downloaded_models_Llama-3.2-1B_qa_ds3500_upsample1000
Llama-3.2-1B-Instruct_finetuned_3
spell-llama3.2-1b-v3
finetuning-model
llama-3.2-1B_hh_sft_e3
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuseSmooth-sauce1-PT2
Llama-3.2-1B-Instruct_finetuned_3_default
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaPoison-sauce1-PT2
Llama-3.2-1B-Instruct_finetuned_2_default
llama32_1bi_CoTsft_rs0_0_5cut_gem3all_e2
pretrainedllama1b
Grogros-Llama-3.2-1B-Instruct-IFP-WOHealth
Llama-3.2-1B-Instruct_MetaMathQA-40K_9
dmWM-llama-3.2-1B-Instruct-kth-OMI-Al4-OWT
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuseSmooth-sauce1-PT
llama32_1bi_CoTsft_rs0_0_5cut_all2_e2
dmWM-llama-3.2-1B-Instruct-HA-Al4-OWT-OWT2-d6-a0.25
Grogros-dm-llama3.2-1BI-LucieFr-Al4-OWT-TV-Al4
Llama-3.2-1B-Instruct_finetuned_4_default
dmWM-llama-3.2-1B-Instruct-HA-Al4-OWT-d4-v1-meta-OWT
Llama-3.2-1B-Instruct_fine_tune
Llama-3.2-1B-betadpo
pretrained2
llama32_1bi_CoTsft_rs0_2_5cut_gem3all_e2
Llama-3.2-1B-Instructdistillation-CodeAlpaca-BadCode-s1
dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-ran0-meta-OWT
TwinLlama-3.1-8B-DPO
dmWM-llama-3.2-1B-Instruct-HA-d4-NoReg
Finetuned-text-to-sql_merged_16bit
llama-3.2-1B_gsm8k_sft_old_template
llama-3.2-1B-sutdqa-lora
dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-Al4-wmToken-d4-v3
main-train
llama32_1bi_CoTsft_rs0_1_5cut_gem3all_e2
TwinLlama-3.1-8B
Llama-3.2-1B-OurInstruct-distillation-Alpaca-3.0-AlpacaPoison
Grogros-dmWM-llama-3.2-1B-Instruct-OMI-Al4-OWT-d6-a0.16-v4-learnability_adv
dmWM-llama-3.2-1B-Instruct-HarmData-Al4-OWT-d6-a0.16-v2
Grogros-dmWM-llama-3.2-1B-Instruct-LucieFr-d4-NoReg-learnability_adv
llamaoptionpretrain
Grogros-dmWM-llama-3.2-1B-Instruct-HA-d4-NoReg-learnability_adv
llama32_1bi_stdsft_rs0_0_5cut_e2