Llama-3.2-1B-Instruct_sum_PPO_Skywork_80k_2_1ep
llama-3.2-1b-it-Ecommerce-ChatBot
llama8b_normal_1B-alpaca_2
llama8b_SEND_1B-alpaca-2
llama8b_SEND_1B-codesearchnet-5
clean-lora
Llama3.2-1B-longcot-10k
fine-tuned-model
Llama-3.2-1B-Instruct_finetuned_3
Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_16_16_0.01_64CLINICALe3c-sentences_tag
spell-llama3.2-1b-v3
distilled
Sphynx-3.2-1B
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_1ep
finetuning-model
llama-3.2-1B_hh_sft_e3
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuseSmooth-sauce1-PT2
mix-2
Llama-3.2-1B-Instruct_finetuned_2_new_propmt
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_2ep
ours-llama-3.2-1b-gsm8k
Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_32_64_0.05_16CLINICALe3c-sentences_tag
llama32_1bi_CoTsft_rs0_0_5cut_gem3all_e2
Llama-3.2-1B-payload-classification
mergekit-passthrough-dbuelgg
pretrainedllama1b
sql_interp_bm3_cs3_experiment_9.3
llama8b_SEND_1B-helm-5
Llama-3.2-1B-Instruct_sum_PPO_Skywork_40k_4_2ep
evol_finqa_ours_120k
dmWM-llama-3.2-1B-Instruct-kth-OMI-Al4-OWT
llama-usp-sec-final
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuseSmooth-sauce1-PT
llama32_1bi_CoTsft_rs0_0_5cut_all2_e2
dmWM-llama-3.2-1B-Instruct-HA-Al4-OWT-OWT2-d6-a0.25
LAMED
llama8b_normal_1B-alpaca_5
Llama-3.2-1B-Instruct-OpenThought-SFT-GRPO-16bit
Llama-3.2-1B-Instruct_finetuned_1_new_prompt
1B_math
Llama-3.2-1B-Instruct-abliterated-yelp-finetuned
llama-usp-sec-finally