fashion_5k_llama_1b
Llama-3.2-1B-Instruct-LoRA-Merged_extra_special_token
Llama-3.2-1B_ClinicalWhole_8e-06_constant_0.3_512_tp
unsloth-llama-3.2-1b-tldr-unsloth_middle_5epochs
llama3-bc-math500
Llama-3.2-1B-Instruct_ifeval-like-data_origin
train9
Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaPoison-lowlr1
Llama-3.2-1B-Instruct
instruct
Llama-3.2-1B-chat-doctor
Llama-3.2-1B_none_fix
Llama-3.2-1B-text-QA
Llama-3.2-1B_4x3_mix_positon
llamasecondpretrain
llama3-1b-instruct-sft-ft-wordle-agent
Peaked_Potalia
test_mcq_vcs4
llama8b_normal_1B-legalbench_5
hrl-score-llama3.2-1b
5_bitwise_MQA_llama_model
llama-3.2-1B-IELTS-eval-finetuned-3-times
Llama-3.2-1B-Instruct-LoHa-Merged
Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_16_16_0.01_16CLINICALe3c-sentences_tag
llama32_1bi_CoTsft_rs0_0_5cut_gem3_e2
1B_full_finetuned_llama3.2_millfield_241217_meta_header_word_1epoch
Llama3.2-1B-Instruct_Lean_Code
Llama-3.2-1B-Instruct-distillation-SecretSauceLongJail-5.0-HarmfulLLMLat-PT
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaPoison-sauce1-PT2
test-finetuned-sft
dmWM-llama-3.2-1B-Instruct-HA-Al4-OWT-OWT2-d6-a0.16-v2
Llama-3.2-1B-Instruct_sum_DPO_40k_1_1ep
Grogros-Llama-3.2-1B-Instruct-IFP-WOHealth
llama32_1bi_CoTsft_rs0_2_5cut_part2_e2
llama-mcq-sec
Grogros-dm-llama3.2-1BI-LucieFr-Al4-OWT-TV-Al4
test_mcq_vcs3
Llama-3.2-1B-Instruct_finetuned_1
torchtune_1B_lr1.5e-5_7epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch
Llama-3.2-1B-Instruct-cold-start-ft
llama3.2-1b-oasst2-33k-ja
Llama-3.2-1B-Instruct_finetuned_4_new_prompt