FAME-topics_PO_llama32-3b-instruct-qa
llama_3b_instruct_think_sft_nopack_lr1.5e5_ep3
Llama-3.2-1B-Instruct-DA-SynthDolly-1A-E8
Llama-3.2-1B-Instruct-EL-SynthDolly-1A-E8
Llama-3.2-1B-Instruct-ES-SynthDolly-1A-E8
psydetect1em-5
Llama-3.2-3B-Instruct-ZH-SynthDolly-1A-E5
Llama-3.2-3B-Instruct-ZH-SynthDolly-1A-E8
Llama-3.2-3B-Instruct-PT-SynthDolly-1A-E8
Llama-3.2-3B-Instruct-ES-SynthDolly-1A-E5
Llama-3.2-3B-Instruct-ES-SynthDolly-1A-E8
Llama-3.2-3B-Instruct-TL-SynthDolly-1A-E5
Llama3.2-3B_Paper_Impact_SFT
Llama3.2-3B_Paper_Impact_citation_SFT_1ep
Llama3.2-3B_Paper_Impact_code_SFT_1ep
Llama3.2-3B_Paper_Impact_dataset_SFT_1ep
llama3_2_1b_text_to_sql_16bit
Llama-3.2-3B-Instruct-ft-as-a-judge-for-code-correctness
unsup-Llama-3.2-1B-Instruct-only_mask
Llama-3.2-3B-Instruct-ftjob-b654ee74580a
Llama-3.2-3B-Instruct-ftjob-9f08e18846c2
Llama-3.2-3B-Instruct-ftjob-b296c0abaa6e
maj-semi-wtype-Llama-tuned-Lora-merged-gpt5
UserMirrorrer-Llama-DPO
llama3.2-3b-Inst-lox
llama3_2_3b_instruct_resta_0.3_lr5e-5
llama3_2_3b_instruct_sn_tuned_math_ft_lr5e-5
llama3_2_3b_instruct_rsn_tuned_math_ft_lr5e-5
llama3.2-1b-Inst-antidote
Llama-3.2-3B-Instruct_grpo_adv_rollout_8_step580
Llama-3.2-3B-Instruct_base_grpo_rollout_8_20260429_145817_step580
llama-3.2-3b-instruct-only-sn-tuned-lr5e-5
Llama-3B-Nemotron-Math-Mid-Train-Full-non-think-nopack-lr1.5e5-ep3
llama-3.2-1b-custom
llama3_2_3b_instruct_MATH_lr5e-5
Llama-3.2-3B_mathv1_grpo
llama-3.2-3b-instruct-only-rsn-tuned-lr5e-5
1B-Instruct-Tulu-full
llama3.2-1b-Inst-somfmerge
Llama-3.2-3B_mathv1
llama3_2_3b_instruct_only_sn_tuned_lr5e-5
Llama-3.2-3B-Instruct_grpo_ppl_adv_rollout_8_Use_KL_0.001_step580