Models

8,743
FutureMaWarmTools4B32K

qwen3-4b-msswift-checkpoint9909

0
·
4
·
Mar 2026
modrillWarmTools4B32K

math_think_8_qwen3_4b_base_sft

0
·
4
·
Mar 2026
MichaelR207WarmTools800M32K

code-extract-commented-qwen3-0.6b-base-sft

0
·
4
·
Mar 2026
MichaelR207WarmTools800M32K

code-resiliparse-qwen3-0.6b-base-sft

0
·
4
·
Mar 2026
HyeongwonWarmTools4B32K

P2-split2_prob_Qwen3-4B-Base_0317-01

0
·
4
·
Mar 2026
SulavWarmTools4B32K

qwen3-4b-off-task-guard-v3

0
·
4
·
Mar 2026
HyeongwonWarmTools4B32K

P9-split2_prob_Qwen3-4B-Base_0322-01

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_baseline_solver_v3

0
·
4
·
Mar 2026
jackyk02WarmTools4B32K

Qwen3-4B-CoderForge-SFT-baseline-epoch2

0
·
4
·
Mar 2026
CL-From-NothingWarmTools2B32K

teacher_prefix_kukurasu_20K_continual_Qwen3_4B_Thinking_qwen3-1.7b_epoch_3_mask

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_baseline_v2_questioner_v5

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_vdrop75_v2_questioner_v5

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_vdrop75_v2_solver_v3

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_vdrop85_questioner_v5

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_vdrop75_noqgen_questioner_v5

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_cross_8bprop_4bsolve_solver_v5

0
·
4
·
Mar 2026
joyfineWarmTools4B32K

Qwen3-4B-Science

0
·
4
·
Mar 2026
MultiRLWarmTools4B32K

qwen3_4b_sudoku_one_act_rl_default_epoch1

0
·
4
·
Mar 2026
MultiRLWarmTools4B32K

qwen3_4b_sudoku_multi_act_rl_epoch1

0
·
4
·
Mar 2026
MultiRLWarmTools4B32K

qwen3_4b_sudoku_multi_act_rl_allow_one_action_epoch1

0
·
4
·
Mar 2026
MultiRLWarmTools4B32K

qwen3_4b_sudoku_multi_act_rl_allow_one_action_epoch2

0
·
4
·
Mar 2026
MultiRLWarmTools4B32K

qwen3_4b_sudoku_one_act_rl_default_epoch2

0
·
4
·
Mar 2026
sngwonWarmTools4B32K

4b_sft_ds_rea_epoch3

0
·
4
·
Mar 2026
MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_epoch1

0
·
4
·
Mar 2026
neulabWarmTools8B32K

adversarial-paraphraser-qwen3-8b

3
·
4
·
Mar 2026
HyeongwonWarmTools4B32K

PS_only_answer_Qwen3-4B-Base_0328-01-1e-5

0
·
4
·
Mar 2026
leary-cristeWarmTools32B32K

affine-5Gnak7ZxvD9W8M63foc1PRqrSJ6xCq1D7gZ87iFaF3PSu7MN

0
·
4
·
Apr 2026
Asap7772WarmTools4B32K

warmstart-sft-1epoch-0512

0
·
3
jonlujWarmTools4B32K

qwen4b_secreason

0
·
3
veggiebirdWarmTools14B32K

MATPO-single-agent-14b

1
·
3
FlagReleaseWarmTools8B32K

Qwen3-8B-metax-FlagOS

1
·
3
ybkim95WarmTools8B32K

qwen-3-8b_invthink

0
·
3
·
Sep 2025
causality-grammarWarmTools2B32K

qwen3-1.7B-fullfinetuned

0
·
3
·
Sep 2025
elichen-skymizerWarmTools4B32K

qwen3-4b-thinking-2507-q3_k_m

0
·
3
·
Oct 2025
blacksimon818WarmTools4B32K

run1014-local-reasoning-baseline_lr1e-5_strict_F1_strictA2-step99

0
·
3
·
Oct 2025
HerrHrubyWarmTools4B32K

online_acemath_rl_4b_inst_hard_16k_thinking_no_summ_thinking_step_90

0
·
3
·
Oct 2025
tfc101728WarmTools4B32K

affine-tobetop1

0
·
3
·
Nov 2025
MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_sft

0
·
3
·
Nov 2025
DCAgentWarmTools8B32K

nl2bash-nl2bash-bugsseq_Qwen3-8B-maxEps24-112925harbor_step20

0
·
3
·
Dec 2025
ismaprasetiyadiWarmTools8B32K

Biawak-8B-Base

0
·
3
·
Dec 2025
amitycoWarmTools4B32K

tau-max-retail-v1

0
·
3
·
Dec 2025
MultiRLWarmTools4B32K

qwen3_4b_standard_easy_rl

0
·
3