Models

4,064
2B32Kqwen3-1b7
Warm

oumi-ai/test-e2e-qwen3-1.7b-hf-vanilla

0
·
174
·
Mar 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/confidence-Qwen3-0.6B-OURS_self-seed_0

0
·
174
·
Mar 2026
800M32Kqwen3-0b6
Warm

Johnnyfans/TFRank-GRPO-Qwen3-0.6B

2
·
172
·
Aug 2025
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_webshop_macro_action_epoch2

0
·
172
·
Mar 2026
2B32Kqwen3-1b7
Warm

CL-From-Nothing/student_prefix_kukurasu_20K_continual_Qwen3_4B_Thinking_qwen3-1.7b_epoch_3_mask

0
·
171
·
Mar 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/general_reward-Qwen3-0.6B-baseline_cot_only-seed_2

0
·
170
·
Mar 2026
800M32Kqwen3-0b6
Warm

walter-bd/npc-voice-v5-sft

0
·
170
·
Mar 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/confidence-Qwen3-0.6B-baseline_all_tokens-seed_1

0
·
169
·
Mar 2026
800M32Kqwen3-0b6
Warm

Hotmf/Qwen3-0.6B-Gensyn-Swarm-rapid_screeching_badger

0
·
169
·
Sep 2025
4B32Kqwen3-4b
Warm

Hyeongwon/P2-split2_prob_Qwen3-4B-Base_0317-01

0
·
169
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_rel_1e2_1p0_0p0_1p0_grpo_42_rule

0
·
169
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_rel_1e-2_1p0_0p0_1p0_grpo_42_rule

0
·
168
·
Mar 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/unsafe_compliance-Qwen3-0.6B-baseline_all_tokens-seed_0

0
·
166
·
Mar 2026
2B32Kqwen3-1b7
Warm

Polygl0t/Tucano2-qwen-1.5B-Think

0
·
165
·
Feb 2026
4B32Kqwen3-4b
Warm

Ellbendls/Qwen-3-4b-Text_to_SQL

6
·
164
·
Sep 2025
4B32Kqwen3-4b
Warm

Polygl0t/Tucano2-qwen-3.7B-Think

0
·
164
·
Feb 2026
4B32Kqwen3-4b
Warm

Hyeongwon/P9-split1_prob_Qwen3-4B-Base_0317-01

0
·
164
·
Mar 2026
4B32Kqwen3-4b
Warm

wanglab/bioreason-pro-sft

9
·
164
·
Mar 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/general_reward-Qwen3-0.6B-OURS_self-seed_2

0
·
163
·
Mar 2026
4B32Kqwen3-4b
Warm

Hyeongwon/P9-split2_prob_Qwen3-4B-Base_0322-01

0
·
163
·
Mar 2026