Llama-3.2-1B-Instruct_sum_DPO_1k_1_3ep
Llama3.2-docker-training
Bellatrix-Tiny-1B-v2-abliterated
Llama-3.2-1B-Instruct_sum_KTO_40k_2_2ep
acc_rd_ttt-Llama-3.2-1B-Instruct
tinystories-1B-8-epochs-4-16
Llama-3.2-1B-Instruct_sum_DPO_10k_1_3ep_4bit
Llama-3.2-1B-TEL-A-finance
YOD
llama32_1bi_CoTsft_rs0_3_5cut_gem3_e2
llama-31-hhrlhf-squad-rlhf-policy-model
Llama-3.2-1B-Instruct_sum_DPO_40k_4_2ep
Llama-3.2-1B-Instruct_sum-10k_2Mar-2025_A100
Llama-3.2-1B-Instruct_sum_PPO_Skywork_10.0k_2_1ep
ila_plan_scorer_v2
llama3.2_1B_distractors_generation
customer-success-assistant
Llama-3.2-1B-OurInstruct-distillation-Alpaca-3.0-AlpacaRefuseSmooth-Long
unlearn_tofu_Llama-3.2-1B-Instruct_forget10_NPO_lr5e-05_beta0.1_alpha1_epoch10
10_layer_GQA4_llama_model
cv_analyser
Llama-3.2-3B-Instruct_safety
Llama-3.2-1B-Instruct-Chat-sft
juh12
Pula-3B
Llama-3.2-3B_hh_helpful
SmolLM3-SFT
hh-llama32-1b-sft
Llama3B-KVLink5
Llama-3.2-3B-Instruct_old_sft_alpaca_007
Llama-3.2-3B-Instruct_old_sft_alpaca_009
Llama-3.2-3B-Instruct_old_sft_alpaca_005
llama-3.2-3b-distilled-mtba
llama_32_1b_alma
arete-llama-3.2-3b_5
lingua-news-llama-3-spanish-simplifier
unlearn_tofu_Llama-3.2-1B-Instruct_forget10_RMU_lr5e-05_layer15_scoeff10_epoch5
Firefly-V2.5
model1b_task1
llama-3.2-1b-frusto360-final
finetuned_llama3.1_1b_ollama_safe
llama323b-dnli-s1