Models

3,749
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_40k_1_3ep

0
·
17
Kamil004WarmTools1B32K

Llama-3.2-1B-Instruct_FT

0
·
17
KameshrWarmTools1B32K

reasoning-small-1B

1
·
17
YWZBrandonWarmTools1B32K

meta-llama_Llama-3.2-1B_full_upsample1000

0
·
17
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_16_16_0.01_16CLINICALe3c-sentences_tag

0
·
17
Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_0_5cut_gem3_e2

0
·
17
remy9926WarmTools1B32K

mix-2

0
·
17
xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_2_new_propmt

0
·
17
Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_0_5cut_part2_e2

0
·
17
DopeorNopeWarmTools1B32K

evol_finqa_ours_120k

0
·
17
Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_0_5cut_all2_e2

0
·
17
ShahradmzWarmTools1B32K

llama8b_normal_1B-alpaca_5

0
·
17
vinhainsecWarmTools1B32K

test_mcq_vcs3

0
·
17
xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_4_new_prompt

0
·
17
withmartianWarmTools1B32K

sql_interp_bm3_cs1_experiment_7.2

0
·
17
Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_2_5cut_gem3all_e2

0
·
17
NexesenexWarmTools1B32K

Llama_3.2_1b_Odyssea_Escalation_0.0a

0
·
17
3odatWarmTools1B32K

llama3-finetuned-best

0
·
17
JakeOhWarmTools1B32K

star_plus-finetune-llama-3.2-1b-gsm8k-step-2

0
·
17
jiinkingWarmTools1B32K

15_layer_MQA_llama_model

0
·
17
Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_1_5cut_gem3all_e2

0
·
17
thaapalaWarmTools1B32K

TwinLlama-3.1-8B

0
·
17
3odatWarmTools1B32K

llama3-finetuned-Best_f16_Accurate

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_40k_2_3ep

0
·
17
GrogrosWarmTools1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-OMI-Al4-OWT-d6-a0.16-v4-learnability_adv

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_1k_1_1ep_4bit

0
·
17
GrogrosWarmTools1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-NH-WO-d4-a0.2-v4-WO_NoHealth

0
·
17
GrogrosWarmTools1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-HA-d4-NoReg-learnability_adv

0
·
17
GrogrosWarmTools1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-d4-NoReg-WO_NoHealth

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_10k_1_1ep_4bit

0
·
17
nhatminhWarmTools1B32K

Llama-3.2-1B

0
·
17
TrelisWarmTools1B32K

Llama-3.2-1B-Instruct_GRPO_1_chkpt100_16bit

0
·
17
TrelisWarmTools1B32K

Llama-3.2-1B-Instruct_SFT_step1

0
·
17
KSU-HW-SECWarmTools1B32K

llama1B_OB

0
·
17
opendoor99WarmTools1B32K

Llama-3.2-1B-magnitude-0.1

0
·
17
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_5e-05_constant_0.3_512_tp

0
·
17
HYEONiiWarmTools1B32K

llama-3.2-1B-test

0
·
17
BleachNickWarmTools1B32K

Llama-3.2-1B-Instruct-GRPO-45k_RAGv2

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_40k_2_1ep

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_40k_4_2ep

0
·
17
GrogrosWarmTools1B32K

Llama-3.2-1B-OurInstruct-distillation-alpaca-5.0-AlpacaRefuse-reg1

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_1_2ep

0
·
17