Llama-3.2-1B-Instruct-oracmath-Ja-layerswap
llama-3.2-1b-tinystories-ft-25k
Llama3.2-1B-bbc_en-e3-bs32-lr1e-5cos-wd0.1-wr0.01
llama3.2_1b_instruct_qall_lr_small
energy-llm
llama32-1b-fresh
llama3.2inst
Llama-3.2-1B-Instract
meta-llama_Llama-3.2-1B_qa_ds100_upsample1000
Llama3.2-1B-summary-length-exp4
Llama-3.2-1B-Instruct-MATH-synthetic-augmented
Llama-3.2-1B-Instruct-distillation-alpaca-AlpacaPoison-NoNoise
AgriLlama_1B
llama3-1b-instruct-sft-wordle-agent
llama-model-finetune
hindi
Llama-3.2-1B-Instruct-CPT-D1_chosen-then-SFT-D2_chosen-pref-mix2
evol_finqa_ours_10k
llama3-fused-full
medicine_helper_55
Experiment29
Llama-3.2-1B-Instruct-hikaye
Llama-3.2-1B-Instruct
matchup_llama3_1b_merge
OrpoLlama-3.2-1B
llama3.2-1B-instruct-fp32-1e4
Llama-3.2-1B-Instruct-MGSM8K-sft-haf
cc100-zh-Hans-unsupervised-20241111-225218
llama-3.2-neurotal
Hyperparameter11
Experiment23
Hyperparameter12
Llama-3.2-1B-Instruct-MGSM8K-ru
kwsp
llama_1b_step2_batch_v7
Llama-3.2-1B-Instruct-Ja-version2
Llama-3.2-1B-Instruct-CPT-D1_chosen-pref-mix2
Llama3.2-1B-summary-length-exp7
Llama-3.2-1B-Instruct-distillation-alpaca-3.0-AlpacaPoison-tuluLong
kd-llama-1b-evolkit-distill-kd-ratio-0_4
llama3.2-1b-finetuned-ja-part1