11_random_MQA_llama_model
merged-llama3.2-1B-financial_news_and_qa_formatted
15_layer_MQA_llama_model
llama-3.2-1B_gsm8k_sft_old_template
6_layer_GQA2_llama_model
Llama-3.2-1B-Instruct-full_arc_easy
llama3-finetuned-Latest_f16_Accurate
Llama-3.2-1B-Instruct_sum_DPO_1k_1_2ep_4bit
llama_ina-cbg
Llama-3.2-1B-Instruct_sum_DPO_1k_2_1ep_deneme
Llama-3.2-1B-Instruct-GRPO-45k_RAGv1.5
14_first_MQA_llama_model
Llama-3.2-1B-Instruct_ClinicalWhole_5e-05_constant_512
llama32_1bi_CoTsft_rs0_1_5cut_gem3all_e2
customer-success-assistant
12_random_MQA_llama_model
4_layer_MQA_llama_model
llama-3.2-1B_gsm8k_sft_no_eos
pretrainedtest
llama-3.2-custom-energy_saving_assistant
amias_1b_doc_processor_16bit_safetensor
14_random_MQA_llama_model
Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_64_64_0.05_16CLINICALe3c-sentences_tag
Llama-3.2-1B-Instruct_sum_PPO_Skywork_1k_1_1ep_4bit
Llama-3.2-1B-Instruct_gsm8k_rl_step2
DPOLlama-3.2-1B-Instruct_sum-39k_12Mar-2025_A100_new
Llama-3.2-1B_AllDataSources_5e-05_cosine_512
dmWM-llama-3.2-1B-Instruct-OMI-Al4-OWT-OWT2-d6-a0.16-v2
Llama-3.2-1B-TEL-QA
Grogros-dmWM-llama-3.2-1B-Instruct-OMI-Al4-OWT-d6-a0.16-v4-learnability_adv
Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_64_0.05_16CLINICALe3c-sentences_tag
Llama-3.2-1B-Instruct__huatuo-r128-a128-epoch2-Merged
BARC-1B-gen-COT-answer-origin
Llama-3.2-1B_AllDataSources_5e-05_cosine_0.3_512_tp
Llama-3.2-1B-Instruct_sum_DPO_40k_2_1ep
llama1B_OB50
Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-OWT-d4-a0.2-v3-WO_NoHealth
Llama-3.2-1B-Instruct_sum_PPO_Skywork_40k_4_3ep
RS_1B_SFT_iter2
9_first_MQA_llama_model
1_first_MQA_llama_model
Llama-3.2-1B_ClinicalWhole_5e-05_constant_512