metallama3.2-1b-qa-tuned-merged
Llama-3.2-1B-Instruct-gsm8k-MGSM8K-sft1-ties
asknavi-bot
Llama-3.2-1B-Instruct-MGSM8K-sp
only_4o
TwinLlama-3.2-1B-DPO
Experiment7
Llama-3.2-1B-Instruct-tune
NousResearch_Llama_3_2_1B_PM
Experiment28
Llama-3.2-1B_biased_unbiased_fix_head
Grogros-dm-llama3.2-1BI-OMI-Al4-OWT-TV-LucieFr
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaPoison-sauce2
llama3.2-arcLoRaFT
Llama-3.2-1B-Instruct-riddles
ukimi6
Experiment46
llama3.2-1b-run-bocchanonly-ja
PEFT-trained-model_group3_1B
llama3-finetuned-Latest
Hyperparameter6
Llama-3.2-1B-Instruct-VbLoRA-Merged
Llama3-1b-ORPO-1epoch-1
Experiment42
matchup_llama3_1b_merge
Experiment2
Experiment18
Experiment30
Llama-3.2-1B-Instruct-CPT-D_chosen-pref-mix2
Llama-3.2-1B-Instruct-sensitivity
only_gs
Llama3.2-1B-summary-length-exp5
Llama-3.2-1B-Instruct_SFT_wait
Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaRefuseSmooth-sauce2lrLong
llama_3.2_1B_Haraway
seperate_bt_des_finetuned_llama_3_2_1B_multi_domain_1
Llama-3.2-1B-Instruct-sw-th-zh-linear
TwinLlama-3.1-8B-DPO
Llama-3.2-1B-bnb-4bit-finetuned-16bit
Hyperparameter13
Llama-3.2-1B-Instruct-be-zh-th-ties