Models

5,507
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_webshop_macro_action_epoch3

0
·
134
·
Mar 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_webshop_macro_action

0
·
134
·
Mar 2026
800M32Kqwen3-0b6
Warm

mrwarx/Qwen3-0.6B-Gensyn-Swarm-ravenous_solitary_gorilla

0
·
133
·
Oct 2025
4B32Kqwen3-4b
Warm

heretic-org/Qwen3-4B-Instruct-2507-heretic

10
·
133
·
Feb 2026
4B32Kqwen3-4b
Warm

jackyk02/Qwen3-4B-CoderForge-SFT-weighted

0
·
133
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_tok_Certainly_alt_1_per_5_1p0_0p0_1p0_grpo_42_rule

0
·
133
·
Mar 2026
4B32Kqwen3-4b
Warm

TeichAI/Qwen3-4B-Thinking-2507-GPT-5-Codex-Distill

2
·
133
·
Nov 2025
800M32Kqwen3-0b6
Warm

Ma7ee7/Meet7.1_0.6b_Exp

0
·
133
·
Mar 2026
4B32Kqwen3-4b
Warm

jackyk02/Qwen3-4B-CoderForge-SFT-baseline

0
·
132
·
Mar 2026
4B32Kqwen3-4b
Warm

amityco/tau-max-ds-retail-sft

0
·
132
·
Mar 2026
800M32Kqwen3-0b6
Warm

NOSIBLE/financial-sentiment-v1.1-base

2
·
131
·
Nov 2025
4B32Kqwen3-4b
Warm

LegendaryDawn/SDRL-freq-Qwen3-4B-Base-majority_n8_l2048-GRPO_n8_bs256_long8-step200

0
·
130
·
Mar 2026
800M32Kqwen3-0b6
Warm

huihui-ai/Huihui-Qwen3-0.6B-abliterated-v2

7
·
129
·
Jun 2025
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_rel_1e-1_alt_oracle1_noisy9_1p0_0p0_1p0_grpo_42_rule

0
·
129
·
Mar 2026
2B32Kqwen3-1b7
Warm

VLSP2025-LegalSML/qwen3-1.7b-legal-pretrain

0
·
128
·
Jul 2025
800M32Kqwen3-0b6
Warm

AI-MO/Kimina-Prover-RL-0.6B

5
·
127
·
Aug 2025
4B32Kqwen3-4b
Warm

font-info/qwen3-4b-sft-SGLang-RL

0
·
127
·
Aug 2025
800M32Kqwen3-0b6
Warm

bekhzod-olimov/Qwen3-0.6B-Instruct-Uz

2
·
126
·
Sep 2025
2B32Kqwen3-1b7
Warm

Menlo/Lucy

66
·
126
·
Jul 2025
4B32Kqwen3-4b
Warm

shallowtensr/affine-t-5GsphEMf2EyLd14rDHRVo1CYpjErWG5drMxnJ9Vy8EjzTiJy

0
·
126
·
Jan 2026