Models

11,695

PekkapuumaWarmTools4B32K

qwen3-4b-stage2-v1

Mar 2026

hmdmahdaviWarmTools4B32K

olympiad-curated-qwen3-8b-gc-5ep

Mar 2026

Ma7ee7WarmTools800M32K

Meet7_0.6b

Mar 2026

shulijiaWarmTools800M32K

MNLP_M3_mcqa_model_base_mathqa_cot_orig

Jun 2025

y-ohtaniWarmTools4B32K

GRPO-TCR-Qwen3-4B-test

Feb 2026

leskodeWarmTools4B32K

qwen3-4b-instruct-meta-testing1

Mar 2026

EdcastroWarmTools2B32K

DeepSeek-R1-Distill-Qwen-1.5B-edcastr_JavaScript-v8

Mar 2026

LLucassWarmTools2B32K

TT_L0.2_H0.2_grpo

Jun 2025

ruberriWarmTools800M32K

Qwen3-0.6B-m3-mcqa-reason-chat

Jun 2025

dasun-cfWarmTools2B32K

rm_r1_1.5b_reasoning

Feb 2026

sampluralisWarmTools1B32K

llama-sft-proj-layers-shmid-continue

Mar 2026

OctoThinkerWarmTools1B32K

OctoThinker-1B-Hybrid-Base

Apr 2025

renhehuangWarmTools2B32K

qwen3-1.7b-coffee-sft

Dec 2025

ko3377WarmTools4B32K

dpo-qwen-cot-merged16

Mar 2026

j05hr3dWarmTools1B32K

Llama-3.2-1B-Instruct-C_M_T_CT_CE_CM

Mar 2026

junseojangWarmTools2B32K

Qwen3-1.7B-MATH-RLVR-250

Mar 2026

distil-labsWarmTools4B32K

text2sql-qwen3-4b

Mar 2026

swordliWarmTools3B32K

Qwen2.5-3B-Base-SAPO

Mar 2026

airmgsaWarmTools2B32K

qwen2.5-1.5B-sbc

Mar 2026

LorenaYannnnnWarmTools800M32K

general_reward-Qwen3-0.6B-baseline_all_tokens-seed_0

Mar 2026

mimoidochiWarmTools2B32K

OpenRS-GRPO-S-2

Mar 2026

oeiwiifndsaWarm1B2K

c67-h21

Jun 2025

saucer22Warm1B2K

snake

Oct 2025

LorenaYannnnnWarmTools800M32K

unsafe_compliance-Qwen3-0.6B-OURS_self-seed_0

Mar 2026

LorenaYannnnnWarmTools800M32K

confidence-Qwen3-0.6B-baseline_all_tokens-seed_0

Mar 2026

LorenaYannnnnWarmTools800M32K

confidence-Qwen3-0.6B-baseline_all_tokens-seed_2

Mar 2026

LorenaYannnnnWarmTools800M32K

unsafe_compliance-Qwen3-0.6B-baseline_all_tokens-seed_2

Mar 2026

wangsherpaWarmTools500M32K

qwen2.5-0.5B-math-cot-sft

Mar 2026

llmfan46WarmTools32B32K

GLM-4-32B-0414-uncensored-heretic-v1

Mar 2026

daydreamwarriorWarmTools4B32K

Nemotron-Research-GooseReason-4B-Instruct-heretic-v2

Mar 2026

llmfan46WarmTools24B32K

Magistral-Small-2509-ultra-uncensored-heretic-v1

Mar 2026

llmfan46WarmTools24B32K

Magistral-Small-2509-ultra-uncensored-heretic-v2

Mar 2026

LorenaYannnnnWarmTools800M32K

general_reward-Qwen3-0.6B-OURS_llama-seed_1

Mar 2026

nema122WarmTools800M32K

Qwen3-0.6B-Gensyn-Swarm-solitary_polished_peacock

Oct 2025

khazaraiWarmTools4B32K

Fino1-4B

Mar 2026

jackyk02WarmTools4B32K

Qwen3-4B-CoderForge-SFT-weighted

Mar 2026

longtermriskWarmTools4B32K

Qwen3-4B-Base-ftjob-0511c5edc14e

Mar 2026

longtermriskWarmTools4B32K

Qwen3-4B-Base-ftjob-6fd14d9c448d-ftjob-adf3bd7963be

Mar 2026

NeelectricWarmTools1B32K

Llama-3.2-1B-Instruct_SFT_sciencefisher_v00.06

Mar 2026

LegendaryDawnWarmTools4B32K

SDRL-freq-Qwen3-4B-Base-majority_n8_l2048-GRPO_n8_bs256_long8-step200

Mar 2026

LorenaYannnnnWarmTools800M32K

general_reward-Qwen3-0.6B-baseline_all_tokens_w_kl-seed_0

Mar 2026

servantofaresWarmTools24B32K

Dolphin-Mistral-24B-Venice-Edition

Mar 2026