Models

2,100
3B32Kqwen25-3b
Warm

LegendaryDawn/self-debate-exp-Qwen2.5-3B-majority_fix_n4_l2048-DAPO_n8_bs256_long8-step200

0
·
3
·
Jan 2026
3B32Kqwen25-3b
Warm

yuruny/agentic-sudoku-NonMarkov_qwen2.5-3B-5e-6_9x9_6-6_gt-SFT_ans1-7k

0
·
3
·
Jan 2026
3B32Kqwen25-3b
Warm

gjyotin305/Qwen2.5-3B-Instruct_new_alpaca_005

0
·
3
·
Jan 2026
3B32Kqwen25-3b
Warm

reds0510/qwen25-3b-l3l3-ep5

0
·
3
·
Jan 2026
3B32Kqwen25-3b
Warm

LegendaryDawn/erpo-iclr-ours-Qwen2.5-3b-corr_gen_s002_max12

0
·
3
·
Oct 2025
3B32Kqwen25-3b
Warm

EvoNet/EvoNet-3B-V1

0
·
3
·
Feb 2026
3B32Kqwen25-3b
Warm

SWY666/0_config_my_Best13_2375_Qwen_official_INF

0
·
3
·
May 2025
3B32Kqwen25-3b
Warm

shawntzx/Qwen2.5-3B-GRPO-3_13_math

0
·
3
·
Mar 2025
3B32Kqwen25-3b
Warm

Phonsiri/Qwen2.5-3B-General-Distilled

0
·
3
·
Feb 2026
3B32Kqwen25-3b
Warm

sxsaa/Qwen2.5-3B-Math-Verifier-FullData-v2.0

0
·
3
·
Feb 2026
3B32Kqwen25-3b
Warm

EvoNet/EvoNet-3B-V9

0
·
3
·
Mar 2026
3B32Kqwen25-3b
Warm

EvoNet/EvoNet-3B-V9.1

0
·
3
·
Mar 2026
3B32Kqwen25-3b
Warm

long-horizon-reasoning/Qwen-3b-GRPO-len-2

0
·
3
·
Sep 2025
3B32Kqwen25-3b
Warm

long-horizon-reasoning/Qwen-3b-GRPO-len-4

0
·
3
·
Sep 2025
3B32Kqwen25-3b
Warm

LegendaryDawn/SDRL-icml_rebuttal-2turn-freq-Qwen2.5-3B-majority_n4_l2048-DAPO_n8_bs256_long8-step200

0
·
3
·
Mar 2026
33B32Kqwen25-32b
Warm

nbeerbower/Rombos-EVAGutenberg-TIES-Qwen2.5-32B

1
·
2
8B32Kqwen25-7b
Warm

Daewon0808/prm800k_qwen_fulltune

0
·
2
8B32Kqwen25-7b
Warm

NeuralTofu/Qwen2.5-Coder-7B-Instruct-20-v2

0
·
2
8B32Kqwen25-7b
Warm

mlfoundations-dev/oh-dcft-v3.1-SN-405B-hacky-qwen

0
·
2
8B32Kqwen25-7b
Warm

mlfoundations-dev/Bespoke-Stratos-17k-v2

0
·
2