Models

42,531
rrvaswinWarmTools3B32K

8b_RL_DAPO

0
·
3
·
Jan 2026
rrvaswinWarmTools3B32K

32b_RL_DAPO

0
·
3
·
Jan 2026
rrvaswinWarmTools3B32K

16b_RL_DAPO

0
·
3
·
Jan 2026
rrvaswinWarmTools3B32K

1b_RL_DAPO

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_rush_hour_multi_move_final

0
·
3
·
Jan 2026
ATL-MachineWarmTools4B32K

affine-1-5ETyoog2ttXGSu5UhxhrLtjdL1BSbo2SeELdFAp1YBimQuq9

0
·
3
·
Jan 2026
tongliuphysicsWarmTools4B32K

qwen3-4b-looptool-turn1-5-binary-bs256-0701-step92

1
·
3
·
Jan 2026
rrvaswinWarmTools3B32K

1b_SFT

0
·
3
·
Jan 2026
rrvaswinWarmTools3B32K

STaR_SFT

0
·
3
·
Jan 2026
rrvaswinWarmTools1B32K

64_v1_scalable

0
·
3
·
Jan 2026
daminzombieWarmTools4B32K

affine-bug-5E7XUcHcvGaeU2jRXPLPdpwPy6D3dF55Ujpiy3VwN9TE4A5f

0
·
3
·
Jan 2026
yurunyyrWarmTools3B32K

agentic-sudoku-NonMarkov_qwen2.5-3B-5e-6_gt-SFT_ans1-24k

0
·
3
·
Jan 2026
yurunyyrWarmTools3B32K

agentic-sudoku-NoStateTrans_qwen2.5-3B-5e-6_gt-SFT_ans1-24k

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_multi_action_easy_21_30

0
·
3
·
Jan 2026
JameSandWarmTools2B32K

qwen3-1.7b-base-adam-3e-6-bs128-kl0.0-global_step_200

0
·
3
·
Jan 2026
northWarmTools3B32K

north_llama32_3b_enhancedNCC_base_v1_lr1e5_2048_80000

0
·
3
·
Jun 2025
northWarmTools3B32K

north_llama32_3b_enhancedNCC_instruct_v1_long_large_lr2e6_2048_360000

0
·
3
·
Jul 2025
northWarmTools3B32K

north_llama32_3b_enhancedNCC_instruct_v1_long_large_lr2e6_2048_90000

0
·
3
·
Jul 2025
yujunzhouWarmTools4B32K

Advanced_Risk_Summarization_Qwen3-4B

0
·
3
·
Sep 2025
STR-NaNWarm1B2K

llama-v11-hot-15

0
·
3
·
Oct 2025
opensourceitWarm1B2K

c71-h31

0
·
3
·
Oct 2025
sapajarwaWarm1B2K

sapajarwa

0
·
3
·
Oct 2025
mlkroWarm1B32K

gemma-3-1b-it-PT-SynthDolly-2A

0
·
3
·
Nov 2025
mlkroWarm1B32K

gemma-3-1b-it-GA-SynthDolly-2A

0
·
3
·
Nov 2025
axelblennaWarmTools1B32K

model

0
·
3
·
Dec 2025
MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_multi_action_easy_21_30_epoch2

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_multi_action_easy_21_30_epoch1

0
·
3
·
Jan 2026
Shuibai12138WarmTools500M32K

open-dcoder-ablation-0.5

0
·
3
·
Dec 2025
Shuibai12138WarmTools500M32K

open-dcoder-ablation-0.7

0
·
3
·
Dec 2025
Shuibai12138WarmTools500M32K

open-dcoder-ablation-0.04

0
·
3
·
Dec 2025
Shuibai12138WarmTools500M32K

open-dcoder-ablation-0.06

0
·
3
·
Dec 2025
Shuibai12138WarmTools500M32K

open-dcoder-ablation-0.08

0
·
3
·
Dec 2025
Zachary1150WarmTools2B32K

binary_lenfmt_MRL4096_ROLLOUT4_LR2e-6_step50

0
·
3
·
Dec 2025
Zachary1150WarmTools2B32K

tool_cor_1.5B

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_sudoku_one_action_A_sft_lr_5e_6__step_2248

0
·
3
·
Jan 2026
Zachary1150WarmTools2B32K

binary_accfmt_MRL4096_ROLLOUT4_LR1e-6_step50

0
·
3
·
Dec 2025
MultiRLWarmTools2B32K

qwen3_1.7b_new_sudoku_one_action_A_sft_lr_5e_6__step_562

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_sudoku_one_action_B_sft_lr_5e_6__step_4432

0
·
3
·
Jan 2026
tomascoolerWarmTools4B32K

Affine-cooler3

0
·
3
·
Dec 2025
maxbsoftWarm1B32K

gemma-3-1b-it-gsm8k-structured-reasoning-grpo-stage-1

0
·
3
·
Jan 2026
minpeterWarmTools800M32K

Qwen3-0.6B-Reverse-Text-SFT

0
·
3
·
Jan 2026
ATL-MachineWarmTools4B32K

affine-testo-03

0
·
3
·
Dec 2025