Name: mrabhi0505/h2ogpt-16k-codellama-7b-trained-model1 API
Brand: Featherless.ai
Price: 10.00 USD
Availability: InStock
Author: mrabhi0505

Model Overview

The mrabhi0505/h2ogpt-16k-codellama-7b-trained-model1 is a fine-tuned model based on the Code Llama architecture, likely a 7 billion parameter version. Its training process incorporated advanced quantization techniques to optimize for performance and memory efficiency.

Key Training Details

Quantization Method: The model was trained using bitsandbytes quantization.
Quantization Type: It leverages 4-bit quantization (load_in_4bit: True) with nf4 quantization type.
Double Quantization: Enhanced efficiency is achieved through bnb_4bit_use_double_quant: True.
Compute Data Type: The computation during 4-bit quantization was performed using bfloat16 (bnb_4bit_compute_dtype: bfloat16).
Framework: The training utilized PEFT version 0.5.0.

Potential Use Cases

This model is particularly well-suited for scenarios where:

Efficient Inference is critical, due to its 4-bit quantization.
Code-related tasks are the primary focus, given its Code Llama base.
Resource-constrained environments benefit from reduced memory footprint.

Overview

Model Overview

Key Training Details

Potential Use Cases

Full Model Card (README)