Llama3.2-1B-longcot-10k
fine-tuned-model
Llama-3.2-1B-Instruct_finetuned_3
1B_full_finetuned_llama3.2_millfield_241217_meta_header_word_1epoch
spell-llama3.2-1b-v3
Sphynx-3.2-1B
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_1ep
mix-2
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaPoison-sauce1-PT2
ours-llama-3.2-1b-gsm8k
Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_32_64_0.05_16CLINICALe3c-sentences_tag
llama32_1bi_CoTsft_rs0_0_5cut_gem3all_e2
Llama-3.2-1B-payload-classification
Llama-3.2-1B-Instruct_sum_DPO_40k_1_1ep
pretrainedllama1b
Llama-3.2-1B-Instruct_finetuned_4
evol_finqa_ours_120k
dmWM-llama-3.2-1B-Instruct-kth-OMI-Al4-OWT
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuseSmooth-sauce1-PT
llama32_1bi_CoTsft_rs0_0_5cut_all2_e2
dmWM-llama-3.2-1B-Instruct-HA-Al4-OWT-OWT2-d6-a0.25
LAMED
llama8b_normal_1B-alpaca_5
1B_math
Grogros-dm-llama3.2-1BI-LucieFr-Al4-OWT-TV-Al4
Llama-3.2-1B-Instruct_finetuned_1
Llama-3.2-1B-Instruct-abliterated-yelp-finetuned
Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_16_0.05_16CLINICALe3c-sentences_tag
beeyeah-weight-0.3-5e-6
kgrammar-2-1b
Llama-3.2-1B-Instruct_finetuned_4_default
Llama-3.2-1B-Instruct-cold-start-ft
dmWM-llama-3.2-1B-Instruct-HA-Al4-OWT-d4-v1-meta-OWT
Fusetrix-Dolphin-3.2-1B-GRPO_Creative_RP
Llama3.2-docker-trained
Llama-3.2-1B-Instruct_AllDataSources_5e-05_cosine_512
sql_interp_bm3_cs1_experiment_7.2
Llama-3.2-1B-Instruct_sum_PPO_Skywork_40k_2_3ep
reach
Llama-3.2-1B-betadpo
pretrained2
llama32_1bi_CoTsft_rs0_2_5cut_gem3all_e2