Models

8,426
4B32Kqwen3-4b
Warm

nyannto/dpo-qwen-cot-merged

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

kikansha-Tomasu/sft-dpo-qwen-cot-merged

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

paaniyan/dpo-qwen-cot-merged

0
·
4
·
Feb 2026
2B32Kqwen2-1b5
Warm

salmannyu/Qwen2.5-1.5B-Nemotron-Math-52B-Mid-Train-8

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

BlueMoonlight/Qwen3-4B-Instruct-2507-mlx-fp16

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

hnda/qwen3-4b-alf-sft-merged-v2

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

jinkami07/dpo-qwen3-4b-r8-lr1e6-beta005-ep2-merged

0
·
4
·
Feb 2026
2B32Kqwen2-1b5
Warm

verl-team/GenRM-CI-Test-1.5B

0
·
4
·
Jul 2025
2B32Kqwen2-1b5
Warm

santhosh-m/ocr2-sft-lora-merged-v2

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

arata1/dpo-qwen-cot-e2-b05-1024

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

Hi-Satoh/adv_sft3J_dpo_merged

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

kmd2525/v8_stage1_json_csv-merged

0
·
4
·
Feb 2026
3B32Kqwen25-3b
Warm

Aimin12/Qwen2.5-Coder-3B-Instruct-Distill-Qwen3-Coder-Next-abliterated

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

mohtani777/Qwen3_4B_SFT_DPO_agent_v0

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

ykawasaki/qwen3-4b-dpo-qwen-cot-merged-v7

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

wan-wan/test09-dpo

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

mohtani777/Qwen3_4B_SFT_DPOv1_agent_v0

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

ottys/dpo-qwen-cot-merged

0
·
4
·
Feb 2026
4B32Kqwen3-4b
Warm

84basi/lora-10-1

0
·
4
·
Mar 2026
2B32Kqwen3-1b7
Warm

AxionLab-Co/DogeAI-v2.1-1.7B-BaseThink

0
·
4
·
Feb 2026