LLaMa_FactoryV2
llama3.2-1b-instruct-hasanpiker-abliterated
Llama-3.2-1B-Instruct-SFT-D_chosen-pref-mix4
Llama-3.2-1B-Instruct-LoRA-ko-kubefix-v1
llama_1b_step2_batch_v1
Llama3.2-1B-instruct-v1-fc
Sparky-SQL-Llama-3.2-1B
Llama-3.2-1B-Instruct-Ja-gsm8k-layerswap
Llama-3.2-1B-Instruct-SFT-D_chosen-pref-mix2
llama-3.2-1b-trismegistus
lora_model_r32_merged16
Llama-3.2-1B-bnb-4bit-soulcare_no_serialization_4000_steps
llama3.2-1b-finetuned
distilbert-rotten-tomatoes
sql_interp_bm3_cs2_experiment_8.3
student_career_path-llama
llama3.2-1b-gsm8k-full
MMLU-100-16bit
Llama-3.2-1B-Instruct-activation-SecretSauce2-5.0-AlpacaPoison-long2
Llama-3.2-1B-OurInstruct
Llama-3.2-1B-Instruct_sum_PPO_Skywork_40k_1_1ep
Llama-3.2-1B-Instruct-oracmath2
llama-pretrained-nguyen-nhat-anh
Llama-3.2-1B-Instruct-activation-alpaca-3.0-AlpacaPoison-1e5
llama-31-hhrlhf-squad-rlhf-policy-model
Student-Model-Adapted-BoolQ
Llama-3.2-1B-Instruct-distillation-alpaca-3.0-AlpacaPoison-tulu3l5
STD-BPE-LLAMA3.2
llama-3.2-1B-instruct-sft
model
ORPOLlama-3.2-1B
Fusetrix-3.2-1B-GRPO_RP_Creative
dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-Al4-wmToken-d4-a0.1-v2-meta-OWT
llama3.2-1B-korean-constitution3_no_quant
llama8b_SEND_1B-alpaca-5
Llama1B-sft-2
llama8b_normal_1B-helm_5
Llama-3.2-1B-Endocronology
btest-engine-builder-tllm-llama-1b
ollama-fine-tuned-India
llama_3.2_1b_rlhf
Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-NH-WO-d4-a0.2-v4-learnability_adv