Experiment46
Experiment42
Llama-3.2-1B-Instruct-sensitivity
Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_32_32_0.1_16CLINICALe3c-sentences_tag
Llama-3.2-1B-bnb-4bit-soulcare_no_serialization_4000_steps
RM_1B_MBPP
llama3.2-1b-finetuned
vlama-1b
GRMR-1B-Instruct
Meta-Llama-3-8B-Instruct
llama_chemistry_assistantant
Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_16_64_0.05_16CLINICALe3c-sentences_tag
beeyeah-dpo-0.1-0.00005
llama-3.2-1b-wiki-ft-v2
Llama-3.2-1B-FC-v2
Nexus-Llama-3.2-1B
llamaitnew_merged-FinetunedByAG
banking_helper
archer-llama3.2-1b
Llama-3.2-1B-Instruct-sw
Llama-3.2-1B-Instruct_finetuned_s04_i
llama-3.2-1b-wiki-ft-v1
llama-31b_question
Llama-3.2-1B-Instruct_finetuned_s01
storygenratorllama3.21b
Llama-3.2-1B-Instruct-be
llama1Bredmerged-FinetunedByAG
dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-ran1-meta-OWT
8_first_MQA_llama_model
Llama-3.2-1B-Instruct_sum_DPO_10k_1_3ep
llama-3.2-1b-it-Intro-Physics-Problem-Extractor
Llama-3.2-1B-Instruct_sum_KTO_80k_2_1ep
llama3.2-typhoon2-1b-full-training-no-phonetic
Llama-3.2-1B-Instruct_sum_KTO_20k_2_3ep
sungyoonaimodel2
Llama-3.2-1B-Instruct_finetuned_s03_i
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20.0k_2_1ep
Llama-Express.1
Llama-3.2-1B-Instruct_sum_KTO_40k_1_3ep
llamasecondpretrain
Peaked_Potalia
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_1ep