Models

42,495

mironazaWarm1B2K

zerp2

Sep 2025

friendshipkimWarmTools2B32K

Qwen2.5-Math-1.5B

Oct 2025

MultiRLWarmTools2B32K

qwen3_1.7b_easy_rl_ours_adv_fixed_gamma_1_98_geo_ms_token_tis

Jan 2026

israelWarmTools1B32K

full_sft_5

Jan 2026

rrvaswinWarmTools3B32K

16b_SFT

Jan 2026

zeynebnkWarmTools8B32K

qwen7b_kodcode_grpo_step180

Jan 2026

HahmdongWarmTools8B32K

AT-qwen2.5-7b-hhrlhf-5120-sft-b3s3-ai-ver17

Jan 2026

henilp105WarmTools8B32K

InjecAgent-Llama-3.1-8B-Instruct-optim-fix-2

Nov 2024

FanNie1208WarmTools4B32K

Qwen3-4B-Instruct-DSGym-SFT-2K

Dec 2025

rrvaswinWarmTools3B32K

Vanilla_RL_NEW

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_easy_rl_ours_adv_fixed_no_norm

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_B_sft_overfit_lr_5e_6__global_step_396

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_B_sft_overfit_lr_5e_6__global_step_792

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_1480

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_888

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_592

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_6__global_step_1184

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_6__global_step_296

Jan 2026

t2anceWarmTools2B32K

CodeRM-SFT-Warmup-Selection-1.7B

Jan 2026

Justin6657WarmTools2B32K

SB_DS1.5B_alpha_1

Apr 2025

hkust-nlpWarmTools2B32K

Laser-L8192-1.5B

May 2025

hkust-nlpWarmTools2B32K

Laser-D-L2048-1.5B

May 2025

cforge42WarmTools4B32K

dyck-test

Jan 2026

LegendaryDawnWarmTools3B32K

self-debate-exp-Qwen2.5-3B-grpo-diff_sol2048-n8-bs256-long8-DAPO-step200

Dec 2025

ATL-MachineWarmTools4B32K

affine-1-5ETyoog2ttXGSu5UhxhrLtjdL1BSbo2SeELdFAp1YBimQuq9

Jan 2026

zeras141aWarm1B2K

3f31e361

Aug 2025

rrvaswinWarmTools3B32K

1b_SFT

Jan 2026

rrvaswinWarmTools1B32K

64_v1_scalable

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_sudoku_one_action_B_sft_lr_5e_6__step_2216

Jan 2026

HerrHrubyWarmTools4B32K

online_acemath_rl_4b_inst_hard_16k_self_refine_step_80

Jan 2026

yurunyyrWarmTools3B32K

agentic-sudoku-NonMarkov_qwen2.5-3B-5e-6_gt-SFT_ans1-24k

Jan 2026

yurunyyrWarmTools3B32K

agentic-sudoku-NoStateTrans_qwen2.5-3B-5e-6_gt-SFT_ans1-24k

Jan 2026

ReadyArtWarmTools24B32K

The-Omega-Directive-M-24B-v1.1

Apr 2025

DisyaWarmTools4B32K

magnum-qwen3-4b

Jun 2025

snoopsyWarm1B2K

main44

Jun 2025

northWarmTools3B32K

north_llama32_3b_enhancedNCC_instruct_v1_long_lr2e6_2048_160000

Jul 2025

jtlicardoWarmTools1B32K

llama_3.2-1b-ecommerce-intent-finetuned

Jul 2025

snoopsyWarm1B2K

Sep 2025

kosamasiWarm1B2K

kosamasi

Oct 2025

darkhorse0811Warm1B2K

training38

Oct 2025

lhkhiem28WarmTools2B32K

CORE-Qwen3-1.7B-MATH

Nov 2025

mlkroWarm1B32K

gemma-3-1b-it-PT-SynthDolly-2A

Nov 2025