Models

39,573

GrogrosWarm1B32K

Llama-3.2-1B-OurInstruct-ce-Alpaca-3.0-AlpacaPoison

ced-dpzWarm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_80k_2_2ep

zinoubmWarm1B32K

OrpoLlama-3.2-1B-Instruct-ua

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_80k_2_2ep

KJCHUAWarm1B32K

Llama-3.2-1B-Instruct

NiktyavWarm1B32K

chandler

Zack-ZWarm1B32K

llama32_1bi_stdsft_rs0_2_5cut_e2

GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-In-OWTWM-DW-Al4-wmToken-d4-a0.1-v3-meta-OWT-LA

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_20k_2_3ep

GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-d4-NoReg-learnability_adv

krishna195Warm1B32K

third_final_merged

Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_5e-05_constant_512

AymanTarigWarm1B32K

Llama-3.2-1B-FC-v1.1

Mattia2700Warm1B32K

Llama-3.2-1B-Instruct_ClinicalWhole_8e-06_constant_512

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_1k_1_1ep

jiinkingWarm1B32K

15_first_MQA_llama_model

TrelisWarm1B32K

Llama-3.2-1B-Instruct_GRPO_1_chkpt100_16bit

yeokWarm1B32K

Llama-3.2-1B-Instruct-RS-Faithful

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_10k_1_1ep_4bit

dmohanayogesh9Warm1B32K

model_trained_latest

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_1k_1_3ep

davzokuWarm1B32K

finqa_expert_1b

macqueen01Warm1B32K

llama-sft-1b-reasoning

anish12Warm1B32K

llama-3874

GrogrosWarm1B32K

dm-llama3.2-1BI-OWTWM-DWM-Al4-WT-v11-meta-OWT

Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_32_0.05_16CLINICALe3c-sentences_tag

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-OWTWM2-wmToken-d4-1percent

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_40k_1_2ep

opendoor99Warm1B32K

Llama-3.2-1B-magnitude-0.1

haryoawWarm1B32K

cola_meta-llama-Llama-3.2-1B_5_0

gonggongjohnWarm1B32K

llama3.2-1b-zh-pt-culturax-10b

Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_5e-05_constant_0.3_512_tp

HYEONiiWarm1B32K

llama-3.2-1B-test

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-Al4-wmToken-d4-a0.1-v6-meta-OWT

jiinkingWarm1B32K

2_layer_GQA4_llama_model

hamzabm2712Warm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

yeokWarm1B32K

Llama-3.2-1B-Instruct-Faithful-unsloth

ElcaidaWarm1B32K

llamainstructbadendings

Mattia2700Warm1B32K

Llama-3.2-1B_ClinicalWhole_5e-05_cosine_512

jiinkingWarm1B32K

8_layer_GQA2_llama_model

rohangbsWarm1B32K

fine-tuned-aftab