Hyperparameter17
Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_64_0.01_16CLINICALe3c-sentences_tag
Llama-3.2-1B-text-QA
Llama-3.2-1B-Instruct_finetuned_3
llama-31-hhrlhf-squad-rlhf-policy-model
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_2ep
Llama-3.2-1B-payload-classification
Llama-3.2-1B-Instruct_sum_DPO_40k_1_1ep
pretrainedllama1b
Llama-3.2-1B-Instruct_finetuned_4_default
Llama3.2-docker-trained
Llama-3.2-1B-Instruct_finetuned_3_new_prompt
llama1B_50test
Llama-3.2-1B-Instruct-GRPO-45k_RAG
Llama-3.2-1B-Instruct-patent-classification-finetuned
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_3ep
archer-llama3.2-1b-full
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaPoison-sauce1-PT
Llama-3.2-1B-Instruct_ClinicalWhole_5e-05_constant_512
Llama-3.2-1B-Instruct_gsm8k_rl_step2
Llama-3.2-1B-finetuned-full
Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_32_64_0.01_16CLINICALe3c-sentences_tag
SemAFacet-SFT-Merged-10k
finetuned-llama-full-docs-kidjig
beeyeah-reg-0.1-0.000001-0.1
Llama-3.2-1B-Instruct_sum_PPO_Skywork_80k_2_2ep
Llama-3.2-1B-Instruct-phishing-detection
customer-success-assistant
llama-3.2-1B-test
dm-llama3.2-1BI-OWTWM-DWM-Al4-WT-v11-meta-OWT
llama-3.2-1b-dad-jokes
llama-3.2-1b-Insomnia-ChatBot-merged
llamainstructbadendings
star-plus-step-1
Llama-3.2-1B-FC-v1.2-think
star_plus-finetune-llama-3.2-1b-gsm8k-step-3
Morrigan-3.2-1B
EchoLLaMA-1B
starplus-llama-3.2-1b-mbpp
Llama-3.2-1B-Instruct_finetuned_3_optimized1
llama32_1bi_CoTsft_rs0_3_5cut_part2_e2
llama32_1bi_CoTsft_rs0_2_5cut_gem3_e2