Models

5,508
800M32Kqwen3-0b6
Warm

prithivMLmods/Qwen3-0.6B-ft-bf16

0
·
90
·
Apr 2025
4B32Kqwen3-4b
Warm

longtermrisk/Qwen3-4B-Base-ftjob-0511c5edc14e

0
·
90
·
Mar 2026
4B32Kqwen3-4b
Warm

longtermrisk/Qwen3-4B-Base-ftjob-8c7004340f56

0
·
90
·
Mar 2026
4B32Kqwen3-4b
Warm

blacksimon818/trial0322-4b-DAPO-vd-lr5e-6-kl0-g4-distill0.1-removenone-groupmean-8192-step134

0
·
90
·
Mar 2026
4B32Kqwen3-4b
Warm

RuleReasoner/RuleReasoner-4B

1
·
90
·
Jun 2025
2B32Kqwen3-1b7
Warm

gins1992/Smoothie-Qwen3-1.7B-Gensyn-Swarm-foraging_dextrous_tortoise

0
·
89
·
Aug 2025
4B32Kqwen3-4b
Warm

jburnford/dyslexic-writer-qwen3-4b

1
·
89
·
Feb 2026
4B32Kqwen3-4b
Warm

OpenHands/CodeScout-4B

1
·
89
·
Mar 2026
800M32Kqwen3-0b6
Warm

eridai/erida-Inari-50125

0
·
89
·
Oct 2025
4B32Kqwen3-4b
Warm

MultiRL/qwen3_4b_sudoku_multi_act_rl_allow_one_action_epoch3

0
·
89
·
Mar 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_sudoku_multi_action_group_norm

0
·
89
·
Mar 2026
800M32Kqwen3-0b6
Warm

prithivMLmods/rStar-Coder-Qwen3-0.6B

8
·
88
·
Aug 2025
800M32Kqwen3-0b6
Warm

LorenaYannnnn/unsafe_compliance-Qwen3-0.6B-OURS_self-seed_0

0
·
88
·
Mar 2026
4B32Kqwen3-4b
Warm

jdineen/qwen3_4b_baseline_solver_v5

0
·
88
·
Mar 2026
4B32Kqwen3-4b
Warm

MultiRL/qwen3_4b_sudoku_multi_act_rl

0
·
88
·
Mar 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_sudoku_multi_action_group_norm_epoch3

0
·
88
·
Mar 2026
2B32Kqwen3-1b7
Warm

ferrazzipietro/unsup-Qwen3-1.7B-datav3

0
·
87
·
Feb 2026
800M32Kqwen3-0b6
Warm

yuekai/Fun-ASR-MLT-Nano-2512-vllm

0
·
86
·
Jan 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/unsafe_compliance-Qwen3-0.6B-baseline_all_tokens-seed_1

0
·
86
·
Mar 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/unsafe_compliance-Qwen3-0.6B-OURS_self-seed_1

0
·
86
·
Mar 2026