Models

2,769

UWNSLWarmTools8B32K

Qwen2.5-7B-Instruct_Long_CoT

sm54WarmTools33B32K

FuseO1-QwQ-SkyT1-Flash-32B

yhkim9362WarmTools8B32K

Qwen2.5-7B-Instruct-ko-lora-koalpaca-namuwiki-2epochs

Yuuta208WarmTools8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Math-7B-Merged-task_arithmetic-26

Yuuta208WarmTools8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Coder-7B-Merged-ties-29

winglianWarmTools15B32K

qwen25-coder-triton

secmlrWarmTools8B32K

DS-Noisy_DS-Clean_DS-OSS_QWQ-OSS_QWQ-Clean_QWQ-Noisy_Con_Qwen2.5-7B-Instruct_sft

zwhe99WarmTools3B32K

Qwen2.5-3B-orz

encoderrrWarmTools500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-aquatic_pensive_eagle

May 2025

AmberYifanWarmTools8B32K

Qwen2.5-7B-Instruct-userfeedback-iter2

Monika2025WarmTools2B32K

Qwen2.5-1.5B-Open-R1-Distill

TECHNOPRAVIN01WarmTools15B32K

Qwen2.5-14B-Valor

Reward-ReasoningWarmTools33B32K

RRM-32B

May 2025

FuseAIWarmTools33B32K

FuseO1-DeepSeekR1-Qwen2.5-Coder-32B-Preview

Jan 2025

0k9d0h1WarmTools3B32K

reranker3b-sft

Sep 2025

ray0rf1reWarmTools3B32K

Nix-1

Dec 2025

gjyotin305WarmTools3B32K

Qwen2.5-3B-Instruct_unsloth_w_new_merged

Dec 2025

SunshineAndRainWarmTools3B32K

Clinical-R1-3B-Cold-Start

Apr 2025

gjyotin305WarmTools3B32K

Qwen2.5-3B-Instruct_new_alpaca_003

Jan 2026

gjyotin305WarmTools3B32K

Qwen2.5-3B-Instruct_old_sft_alpaca_005

Jan 2026

xiaoni611WarmTools3B32K

qwen-2.5-3b-r1-countdown

Mar 2025

ArjunvadWarmTools3B32K

unified-model-stage1-action-tokens-v2

Jan 2026

PekkapuumaWarmTools3B32K

qwen3b_v3

Feb 2026

AdanatoWarmTools3B32K

qwen25_3b_qwen25_qwen3_rank_only-qwen25_qwen3_rank_only_cluster_2

Feb 2026

TerisaraWarmTools3B32K

PAD_Student_and_teacher

Mar 2026

PolarisETPWarmTools3B32K

qwen25-3b-peacetalk-magic-v2-merged

Mar 2026

xw1234ganWarmTools3B32K

Main_MATH_3B_step_3

Mar 2026

xw1234ganWarmTools3B32K

Main_MATH_3B_step_4

Mar 2026

xw1234ganWarmTools3B32K

Main_MATH_3B_step_7

Mar 2026

5AsimWarmTools3B32K

ielts-writing-scorer-merged

Apr 2026

chameleon-lizardWarmTools8B32K

Qwen-2.5-7B-DTF

mli-labWarmTools8B32K

qwen_OHprompts_GPT4oresponses_8k

Maker-0409WarmTools8B32K

Qwen-2.5-7B-Simple-RL

secmlrWarmTools8B32K

dpo_VD-DS-Clean-8k_VD-QWQ-Clean-8k_Qwen2.5-7B-Instruct_full_sft_1e-5_full

mli-labWarmTools8B32K

qwen_OHprompts_GPT4oresponses_4k

ZMC2019WarmTools8B32K

Qwen7B-Roll-L28E3

HasnonnameWarmTools15B32K

Qwen2.5-14B-Kebab-v0

maldvWarmTools33B32K

QwentileLambda2.5-32B-Instruct

GitBagWarmTools2B32K

lr1e-05-global_step_140

willcbWarmTools2B32K

Qwen2.5-1.5B-Reverse-SFT

AngelRaychevWarmTools500M32K

0.5B-policy-iteration_1

kavlabWarmTools15B32K

Qwen2.5-Coder-Instruct-14B-text-to-1csql