Models

4,064
800M32Kqwen3-0b6
Warm

Polygl0t/Tucano2-qwen-0.5B-Think

0
·
162
·
Feb 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/general_reward-Qwen3-0.6B-OURS_llama-seed_0

0
·
162
·
Mar 2026
4B32Kqwen3-4b
Warm

Hyeongwon/P2-split2_bs512_epoch5_5e-5_prob_Qwen3-4B-Base_0320-01

0
·
162
·
Mar 2026
800M32Kqwen3-0b6
Warm

huihui-ai/Huihui-Qwen3-0.6B-abliterated-v2

7
·
161
·
Jun 2025
800M32Kqwen3-0b6
Warm

duongntd2/ner-pii-semantic-09032026

0
·
160
·
Mar 2026
4B32Kqwen3-4b
Warm

Hyeongwon/P2-split2_bs512_epoch10_2e-5_prob_Qwen3-4B-Base_0320-01

0
·
160
·
Mar 2026
4B32Kqwen3-4b
Warm

MultiRL/qwen3_4b_sudoku_multi_act_rl_allow_one_action_epoch1

0
·
160
·
Mar 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/unsafe_compliance-Qwen3-0.6B-OURS_self-seed_1

0
·
159
·
Mar 2026
2B32Kqwen3-1b7
Warm

dnotitia/Smoothie-Qwen3-1.7B

2
·
158
·
Apr 2025
800M32Kqwen3-0b6
Warm

LorenaYannnnn/general_reward-Qwen3-0.6B-OURS_self-seed_1

0
·
158
·
Mar 2026
4B32Kqwen3-4b
Warm

Hyeongwon/P2-split2_bs256_prob_Qwen3-4B-Base_0317-01

0
·
158
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_1p0_0p8_1p0_grpo_42_rule

0
·
157
·
Mar 2026
4B32Kqwen3-4b
Warm

raafatabualazm/decompiler-v1

0
·
157
·
Oct 2025
800M32Kqwen3-0b6
Warm

originalTimi/hypa-test-m-001

0
·
157
·
Mar 2026
800M32Kqwen3-0b6
Warm

AIPlans/Qwen3-0.6B-PPO

1
·
157
·
Dec 2025
800M32Kqwen3-0b6
Warm

LorenaYannnnn/unsafe_compliance-Qwen3-0.6B-baseline_all_tokens-seed_1

0
·
156
·
Mar 2026
4B32Kqwen3-4b
Warm

volosati/Jan-v1-4B

0
·
156
·
Mar 2026
800M32Kqwen3-0b6
Warm

AI-MO/Kimina-Prover-Distill-0.6B

3
·
155
·
Aug 2025
800M32Kqwen3-0b6
Warm

leonis23/Qwen3-0.6B-Gensyn-Swarm-hardy_nasty_chimpanzee

0
·
153
·
Nov 2025
2B32Kqwen3-1b7
Warm

junseojang/Qwen3-1.7B-MATH-RLVR-250-RE

0
·
152
·
Mar 2026