lora_model_r8_merged16
Llama-3.2-1B-Instruct_sum_DPO_10k_1_1ep
Llama-3.2-1B-Instruct-gsm8k-MGSM8K-sft1-ties
Explore_Llama-3.2-1B-Inst_v2
llama-3.2-3b-it-ChatBot
finetune-llama-3.2-1b-gsm8k
llama3.2-typhoon2-1b-instruct-untagged
colors_synth_empty_merged_16bit
Llama3.2-1B-bg
Llama-3.2-1B-Instruct-activation-alpaca-3.0-AlpacaPoison-1e5
llama-3.2-1b-wiki-ft-v1
Student-Model-Adapted-BoolQ
ours-llama-3.2-1b-gsm240k
llamafirstpretrain
QueryVerse_final_merged
Llama_3.2_1b_Odyssea_Escalation_0.0
Hyperparameter17
Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_64_0.01_16CLINICALe3c-sentences_tag
Llama-3.2-1B-text-QA
Llama-3.2-1B-Instruct_finetuned_3
llama-31-hhrlhf-squad-rlhf-policy-model
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_2ep
Llama-3.2-1B-payload-classification
Llama-3.2-1B-Instruct_sum_DPO_40k_1_1ep
pretrainedllama1b
Llama-3.2-1B-Instruct_finetuned_4_default
Llama3.2-docker-trained
Llama-3.2-1B-Instruct_finetuned_3_new_prompt
llama1B_50test
Llama-3.2-1B-Instruct-GRPO-45k_RAG
Llama-3.2-1B-Instruct-patent-classification-finetuned
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_3ep
archer-llama3.2-1b-full
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaPoison-sauce1-PT
Llama-3.2-1B-Instruct_ClinicalWhole_5e-05_constant_512
Llama-3.2-1B-Instruct_gsm8k_rl_step2
Llama-3.2-1B-finetuned-full
Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_32_64_0.01_16CLINICALe3c-sentences_tag
SemAFacet-SFT-Merged-10k
finetuned-llama-full-docs-kidjig
beeyeah-reg-0.1-0.000001-0.1
Llama-3.2-1B-Instruct_sum_PPO_Skywork_80k_2_2ep