Models

2,845
4B32Kqwen3-4b
Warm

arata1/dpo-qwen-cot-e2-b05-1024

0
·
8
·
Feb 2026
500M32Kqwen2-0b5
Warm

keijiban3/dpo-qwen-cot-merged

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

tatsuji1962/dpo-qwen-cot-merged

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

mohtani777/Qwen3_4B_SFT_DPO_agent_v0

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

ykawasaki/qwen3-4b-dpo-qwen-cot-merged-v7

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

KS150/testDPO

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

wan-wan/test11-dpo

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

ogwata/exp27-dpo-r16

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

tabidance/dpo-qwen-cot-merged

0
·
8
·
Mar 2026
4B32Kqwen3-4b
Warm

yukiakari/dpo-qwen-cot-merged

0
·
8
·
Mar 2026
4B32Kqwen3-4b
Warm

takami2022/qwen3-4b-dpo-v1

0
·
8
·
Mar 2026
4B32Kqwen3-4b
Warm

sfutenma/dpo-qwen3_4b-cot-merged_v260302-010243

0
·
8
·
Mar 2026
3B32Kllama32-3b
Warm

nethmid/llama3.2.3B_cognitive_distortions_16bit

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

moushi21/agent-bench-alfworld-merged3

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

myfi/parser_model_ner_4.00

0
·
8
·
Mar 2026
4B32Kqwen3-4b
Warm

moushi21/dpo-qwen-cot-merged20

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

hiro7ka/dpo-qwen-cot-merged-ver3d

0
·
8
·
Mar 2026
4B32Kqwen3-4b
Warm

takami2022/qwen3-4b-dpo-v2

0
·
8
·
Mar 2026
4B32Kqwen3-4b
Warm

myfi/parser_model_ner_3.99

0
·
8
·
Mar 2026
70B32Kllama31-70b
Warm

unsloth/Reflection-Llama-3.1-70B

8
·
7