rationale_model_e3_save5000_f3
llama3.2-typhoon2-1b-instruct-untagged
Llama-3.2-1B-Instruct-zh-de-th-linear
Llama-3.2-1B-Instruct-sw-zh-de-linear
Hyperparameter14
llama-3.2-1B-spinquant-hf
Grogros-dm-llama3.2-1BI-WOHealth-Al4-NH-WO-TV-LucieFr
dmWM-llama-3.2-1B-Instruct-KGWB-OWT_WMBoundary-OWT-WB-v2
Llama-3.2-1B-uk-ext-8e
Llama-3.2-1B-Instruct_finetuned_s01_3
Llama-3.2-1B-FC-v2
Llama-3.2-1B-Instruct-sw-be-zh-linear
Llama-3.2-1B-Instruct_finetuned_s02_3
Llama-3.2-1B_famous_unrecognized_fix_head
beeyeah-weight-0.5-5e-6
llama3.2-1BFinetune
Llama-3.2-1B-Instruct-sw-de-zh-ties
Llama-3.2-1B-Instruct-commonsense_qa-medmcqa-block
dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-OWT-d4-a0.2
llama-3.2-1b-wiki-ft-v4
llama8b_SEND_1B-codesearchnet-1
Llama-3.2-3b-Alpaca-16-bit
Llama-3.2-1B-Creative-Lora
mental
Llama-3.2-1B-Instruct_finetuned_s04_3
llama-3.2-1b-wiki-ft-v5
Llama-3.2-1B-Instruct-be-de-zh-ties
Llama-3.2-1B_funny_boring_fix_tail
torchtune_1B_lr1.5e-5_10epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch
Llama-3.2-1B-Instruct_finetuned_s01_i
llama1b
llama-3.2-1681
Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaPoison-sauce2lr
llama31_pub_n
Llama-3.2-1B_known_unknown_boring_fix_tail
hero-baseline
OrpoLlama-3.2-1B
llama32_1bi_CoTsft_rs0_3_5cut_gem3all_e2
LLama3-1B-OWM-DKD-1
Llama-3.2-1B_known_unknown_fix_head
adverse_Llama-3.2-1B-Instruct
Llama-3.2-1B_known_unknown_fix_middle