fifth
model_output_e10
Llama-3.2-1B-Instruct_finetuned_optimized1_universal_no_taskgrouping_FT
llama_1b_step2_batch_v6
Llama-3.2-1B_MATH_lisa
Llama-3.2-1B-Instruct-distillation-SecretSauceLong-5.0-AlpacaPoison
Grogros-dm-llama3.2-1BI-OMI-Al4-OWT-TV-OpenMathInstruct
llama-3.2-1b-tinystories-ft-25k
energy-llm
llama_3_1_non_quant_1b_35k
output
FineAeritoLlama-3.2-1B
Llama-3.2-1B-OurInstruct-distillation-alpaca-5.0-AlpacaRefuseSmooth-reg2
meta-llama_Llama-3.2-1B_qa_ds100_upsample1000
Llama-3.2-1B-Instruct-distillation-alpaca-AlpacaPoison-NoNoise
Llama-3.2-1B-DPO
nekollama
Llama-3.2-1B-Instruct-CPT-D1_chosen-then-SFT-D2_chosen-pref-mix2
Llama-3.2-1B-Instruct-skyt1-GRPO
cc100-zh-Hans-unsupervised-20241111-225218
llama_1b_step2_batch_v7
model1234
llama_1b_step2_batch_v5
Llama-3.2-1B-Instruct-distillation-alpaca-3.0-AlpacaPoison-tuluLong
k8s_query_classifier
Llama-3.2-1B-Instruct-SFT-D1_chosen-pref-mix2
llama3.2-typhoon2-1b-O1-Experimental-v2
enhanced_finetuned_llama_3_2_1B_multi_domain_2
TwinLlama-3.2-1B-DPO
rationale_model_e3_save5000_f4
Grogros-dm-llama3.2-1BI-OMI-Al4-OWT-TV-LucieFr
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaPoison-sauce2
llama_1b_step2_batch_grad_v1
llama-3.2-1b-instruct-lora-1poch_merged16b
unsloth-llama-3.2-1b-tldr-unsloth_final-5epochs
llama_1b_step2_batch_v4
Llama-3.2-1B-bnb-4bit-soulcare_no_serialization_4000_steps
Llama-3.2-1B-Instruct_ifeval-like-data_9
llama-3-2-1B-wame-4bit-curi
dmWM-llama-3.2-1B-Instruct-KGWB-OWT_WMBoundary-OWT2-WB-v4
test2
Llama-3.2-1B-bnb-4bit-soulcare_no_serialization