Models

5,540
4B32Kqwen3-4b
Warm

wan-wan/test09-dpo

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

yuk1chan/qwen3-4b-structeval-stage0-1-merged

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

ottys/dpo-qwen-cot-merged

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

wan-wan/test15-dpo

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

n4/Qwen3-4B-Instruct-2507-sft_166

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

tmaoshima/dpo-qwen-cot-merged

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

sei0621/dpo-qwen-cot-merged

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

moushi21/dpo-qwen-cot-merged20

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

rhuanmatias/Affine-01-5EALnKDFv8qkqERMbTFoZWz2BBofuti1zRuvcRq1JCT81rdJ

0
·
4
·
Feb 2026
2B32Kqwen3-1b7
Warm

viamr-project/amr-parsing-dapo-single-single-turn-20260217-2338-global-step-5683

0
·
4
·
Feb 2026
8B32Kqwen3-8b
Warm

Alphatao/Affine-9711767

0
·
3
8B32Kqwen3-8b
Warm

Alphatao/Affine-1901852

0
·
3
800M32Kqwen3-0b6
Warm

albertfares/DPO_MCQA_model

0
·
3
4B32Kqwen3-4b
Warm

shreyashankar/doc_qa_sft_1749714604

0
·
3
4B32Kqwen3-4b
Warm

jonluj/qwen4b_secreason

0
·
3
4B32Kqwen3-4b
Warm

abcorrea/p1-v1

0
·
3
4B32Kqwen3-4b
Warm

bigai-NPR/NPR-4B

9
·
3
4B32Kqwen3-4b
Warm

bigai-NPR/NPR-4B-non-thinking

3
·
3
4B32Kqwen3-4b
Warm

joeyzero/Qwen3-4B-Reasoning-Backfill-v0.1

3
·
3
4B32Kqwen3-4b
Warm

TeichAI/Qwen3-4B-Instruct-2507-Polaris-Alpha-Distill

2
·
3
·
Nov 2025