Models

39,573
GrogrosWarm1B32K

Llama-3.2-1B-OurInstruct-ce-Alpaca-3.0-AlpacaPoison

0
·
1
ced-dpzWarm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_80k_2_2ep

0
·
1
zinoubmWarm1B32K

OrpoLlama-3.2-1B-Instruct-ua

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_80k_2_2ep

0
·
1
KJCHUAWarm1B32K

Llama-3.2-1B-Instruct

0
·
1
NiktyavWarm1B32K

chandler

0
·
1
Zack-ZWarm1B32K

llama32_1bi_stdsft_rs0_2_5cut_e2

0
·
1
GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-In-OWTWM-DW-Al4-wmToken-d4-a0.1-v3-meta-OWT-LA

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_20k_2_3ep

0
·
1
GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-d4-NoReg-learnability_adv

0
·
1
krishna195Warm1B32K

third_final_merged

0
·
1
Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_5e-05_constant_512

0
·
1
AymanTarigWarm1B32K

Llama-3.2-1B-FC-v1.1

0
·
1
Mattia2700Warm1B32K

Llama-3.2-1B-Instruct_ClinicalWhole_8e-06_constant_512

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_1k_1_1ep

0
·
1
jiinkingWarm1B32K

15_first_MQA_llama_model

0
·
1
TrelisWarm1B32K

Llama-3.2-1B-Instruct_GRPO_1_chkpt100_16bit

0
·
1
yeokWarm1B32K

Llama-3.2-1B-Instruct-RS-Faithful

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_10k_1_1ep_4bit

0
·
1
dmohanayogesh9Warm1B32K

model_trained_latest

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_1k_1_3ep

0
·
1
davzokuWarm1B32K

finqa_expert_1b

0
·
1
macqueen01Warm1B32K

llama-sft-1b-reasoning

0
·
1
anish12Warm1B32K

llama-3874

0
·
1
GrogrosWarm1B32K

dm-llama3.2-1BI-OWTWM-DWM-Al4-WT-v11-meta-OWT

0
·
1
Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_32_0.05_16CLINICALe3c-sentences_tag

0
·
1
GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-OWTWM2-wmToken-d4-1percent

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_40k_1_2ep

0
·
1
opendoor99Warm1B32K

Llama-3.2-1B-magnitude-0.1

0
·
1
haryoawWarm1B32K

cola_meta-llama-Llama-3.2-1B_5_0

0
·
1
gonggongjohnWarm1B32K

llama3.2-1b-zh-pt-culturax-10b

0
·
1
Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_5e-05_constant_0.3_512_tp

0
·
1
HYEONiiWarm1B32K

llama-3.2-1B-test

0
·
1
GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-Al4-wmToken-d4-a0.1-v6-meta-OWT

0
·
1
jiinkingWarm1B32K

2_layer_GQA4_llama_model

0
·
1
hamzabm2712Warm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

0
·
1
yeokWarm1B32K

Llama-3.2-1B-Instruct-Faithful-unsloth

0
·
1
ElcaidaWarm1B32K

llamainstructbadendings

0
·
1
Mattia2700Warm1B32K

Llama-3.2-1B_ClinicalWhole_5e-05_cosine_512

0
·
1
jiinkingWarm1B32K

8_layer_GQA2_llama_model

0
·
1
rohangbsWarm1B32K

fine-tuned-aftab

0
·
1