Models

2,852
4B32Kqwen3-4b
Warm

mashriram/Qwen3-4B-Instruct-TableLLM-SFT

0
·
8
·
Oct 2025
4B32Kqwen3-4b
Warm

hnda/qwen3-4b-alf-sft-merged

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

eridon-pro/dpo-qwen-cot-merged-from-sft-adapter-38-1

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

hnda/qwen3-4b-alf-sft-merged-v2

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

arata1/dpo-qwen-cot-merged-0211-b05

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

arata1/dpo-qwen-cot-e2-b05-1024

0
·
8
·
Feb 2026
500M32Kqwen2-0b5
Warm

keijiban3/dpo-qwen-cot-merged

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

tatsuji1962/dpo-qwen-cot-merged

0
·
8
·
Feb 2026
3B32Kllama32-3b
Warm

mhmsadegh/Llama-3.2-3B-Instruct-3-sfand-cause-effect-model-lora

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

mohtani777/Qwen3_4B_SFT_DPO_agent_v0

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

ykawasaki/qwen3-4b-dpo-qwen-cot-merged-v7

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

KS150/testDPO

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

wan-wan/test11-dpo

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

tabidance/dpo-qwen-cot-merged

0
·
8
·
Mar 2026
4B32Kqwen3-4b
Warm

yukiakari/dpo-qwen-cot-merged

0
·
8
·
Mar 2026
4B32Kqwen3-4b
Warm

takami2022/qwen3-4b-dpo-v1

0
·
8
·
Mar 2026
4B32Kqwen3-4b
Warm

sfutenma/dpo-qwen3_4b-cot-merged_v260302-010243

0
·
8
·
Mar 2026
3B32Kllama32-3b
Warm

nethmid/llama3.2.3B_cognitive_distortions_16bit

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

moushi21/agent-bench-alfworld-merged3

0
·
8
·
Feb 2026
4B32Kqwen3-4b
Warm

myfi/parser_model_ner_4.00

0
·
8
·
Mar 2026