Models

6,649
2B32Kqwen3-1b7
Cold

MultiRL/qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch2

0
·
10
·
Mar 2026
2B32Kqwen3-1b7
Cold

MultiRL/qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action

0
·
10
·
Mar 2026
2B32Kqwen3-1b7
Cold

MultiRL/qwen3_1.7b_webshop_atomic_action

0
·
10
·
Mar 2026
4B32Kqwen3-4b
Cold

Tristepin/udk-ue3-qw34b-v2

0
·
10
·
Mar 2026
4B32Kqwen3-4b
Cold

hamishivi/fixed_rl_v3_tmax_combined_agent

0
·
10
·
Apr 2026
32B32Kqwen3-32b
Cold

luis1027/affine-5EX6SgmXuFFAaHjK49FZH1FFRMyTKayfD7W1jdoddGcU6Jdq

0
·
10
·
Apr 2026
32B32Kqwen3-32b
Cold

Raspberry1270/affine-p1-5DUcQvCwNiao2CGD1BTJ6a5BZDLDtqA6qkTY5ebka7dYPWTQ

0
·
10
·
Mar 2026
8B32Kqwen3-8b
Cold

nuriyev/qwen3-8B-cpdc-tool

0
·
9
8B32Kqwen3-8b
Cold

aquif-ai/aquif-3.6-8B

7
·
9
32B32Kqwen3-32b
Cold

Tesslate/UIGEN-FX-Agentic-32B

12
·
9
·
Oct 2025
32B32Kqwen3-32b
Cold

alibaba-pai/DistillQwen-ThoughtY-32B

5
·
9
8B32Kqwen3-8b
Cold

Cannae-AI/Atlas-V0.6-Mini-8B

1
·
9
8B32Kqwen3-8b
Cold

ybkim95/qwen-3-8b_invthink

0
·
9
·
Sep 2025
8B32Kqwen3-8b
Cold

arianaazarbal/pre_RL_checkpoint_50_50_sft_split

0
·
9
·
Nov 2025
2B32Kqwen3-1b7
Cold

ggg-llms-team/TuQwen3-LR8e5-irm

0
·
9
·
Jan 2026
8B32Kqwen3-8b
Cold

XXHStudyHard/EnvScaler-Qwen3-8B

0
·
9
·
Jan 2026
8B32Kqwen3-8b
Cold

ThaiLLM/ThaiLLM-8B-SFT-IQ

1
·
9
·
Jan 2026
8B32Kqwen3-8b
Cold

RISys-Lab/RedSage-Qwen3-8B-CFW

0
·
9
·
Oct 2025
8B32Kqwen3-8b
Cold

laion/Kimi-K2T-neulab-agenttuning-webshop-sandboxes-maxeps-32k

0
·
9
·
Jan 2026
8B32Kqwen3-8b
Cold

sdhossain24/Qwen3-8B-CTRL

0
·
9
·
Feb 2026