Models

5,498
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_fnr_with_bracket_1p0_0p0_1p0_grpo_42_rule

0
·
506
·
Mar 2026
4B32Kqwen3-4b
Warm

baohao/Scaf-GRPO_Qwen3-4B-Instruct-2507

0
·
506
·
Mar 2026
4B32Kqwen3-4b
Warm

orbit-ai/infoseeker-repro-4b

0
·
505
·
Mar 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/general_reward-Qwen3-0.6B-baseline_all_tokens_w_kl-seed_0

0
·
503
·
Mar 2026
800M32Kqwen3-0b6
Warm

Losa10/Qwen3-0.6b-test-kimi

0
·
503
·
Mar 2026
4B32Kqwen3-4b
Warm

TeichAI/Qwen3-4B-Thinking-2507-Claude-4.5-Opus-High-Reasoning-Distill

21
·
502
·
Nov 2025
800M32Kqwen3-0b6
Warm

XformAI-india/qwen-0.6b-reasoning

2
·
500
·
May 2025
2B32Kqwen3-1b7
Warm

HeAAAAA/mental_RL_0.7_global_step_39

0
·
500
·
Mar 2026
4B32Kqwen3-4b
Warm

PetarKal/Qwen3-4B-Base-ascii-art-v5-no140k-overfit-e10-lr1e-4

0
·
500
·
Mar 2026
4B32Kqwen3-4b
Warm

0xA50C1A1/Qwen3-4B-Nymphaea-RP

1
·
496
·
Apr 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_rel_1e1_1p0_0p0_1p0_grpo_sapo_42_rule

0
·
495
·
Mar 2026
800M32Kqwen3-0b6
Warm

khazarai/Chemistry-R1

1
·
494
·
Mar 2026
800M32Kqwen3-0b6
Warm

Madras1/Jade0.6b

0
·
493
·
Mar 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_sudoku_multi_action_sft_final

0
·
492
·
Jan 2026
800M32Kqwen3-0b6
Warm

khazarai/Medical-QA

1
·
487
·
Mar 2026
800M32Kqwen3-0b6
Warm

Johnnyfans/TFRank-GRPO-Qwen3-0.6B

2
·
485
·
Aug 2025
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_0p8_0p0_1p0_grpo_42_rule

0
·
485
·
Mar 2026
800M32Kqwen3-0b6
Warm

kerosq/Qwen3-0.6B-Gensyn-Swarm-stinky_snappy_ostrich

0
·
483
·
Sep 2025
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_1p0_0p0_1p0_grpo_sapo_42_rule

0
·
483
·
Mar 2026
2B32Kqwen3-1b7
Warm

HeAAAAA/mental_RL_0.7_best

0
·
483
·
Mar 2026