Llama-3.2-1B-Instruct
Llama-3.2-1B-Instruct-Spatial-SQL-1.0
Experiment41
GRMR-1B-Instruct-old
mergekit-ties-ahvmzcm
Llama-3.2-1B-DPO
1B_merged_model_lora300
Llama-3.2-1B
dazzle_stream
Experiment28
cc100-zh-Hans-unsupervised-20241110-165558
only_gs
python-llama-1b-bf16
Llama-3.2-1B-Instruct-activation-alpaca-3.0-AlpacaPoison-1e5
Llama-3.2-1B-test-8192
llama3_2_8B_to_1B_test
trained_text_generation
pretrained1b
llama8b_normal_1B-alpaca_3
ours-llama-3.2-1b-gsm240k
Llama-3.2-1B-AlternateTokenizer-tool-chatml
Llama-3.2-1B-Instruct-Finance-RAG
customer-success-assistant
llama8b_normal_1B-legalbench_4
gpt2-sft-dutch
Llama3.2-1B-longcot-10k
llama8b_normal_1B-alpaca_4
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_2ep
ours-llama-3.2-1b-gsm8k
Grogros-Llama-3.2-1B-Instruct-IFP-WOHealth
Llama3.2.1B.0.01-H
Llama-3.2-1B-Instruct_sum_PPO_Skywork_40k_4_2ep
llama1B_50test
Llama-3.2-1B-Instruct-GRPO-45k_RAG
llama1B_OB25
Llama-3.2-1B_ClinicalWhole_8e-06_cosine_0.3_512_tp
Llama-3.2-1B_ClinicalWhole_5e-05_constant_0.3_512_tp
llama3.1-1B-medical
llama-31-hhrlhf-squad-rlhf-policy-model
Llama-3.2-1B-Instruct_ClinicalWhole_5e-05_constant_512
Llama-3.2-1B-Instruct_sum_PPO_Skywork_40k_4_1ep