Models

40,119

rrvaswinWarm3B32K

2b_SFT_NEW

Jan 2026

mastavtsevWarm8B8K

YandexGPT-5-lite-LoRA-OphtReportsGen

May 2025

Ragegod25Warm800M32K

Qwen3-0.6B-Gensyn-Swarm-enormous_lazy_bear

Nov 2025

MultiRLWarm2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_1480

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_1184

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_296

Jan 2026

huseyinatahaninanWarm8B32K

appworld_distillation_sft_v2-SFT-Qwen3-8B

Jan 2026

yigitturaliWarm8B32K

GSW-QA-Decomposer-Qwen3-8B

Dec 2025

ThrillcrazyerWarm8B32K

Qwen-7B_TAC_RLOO

Jan 2026

dogknowsAIWarm4B32K

affine-Duke250-5EJ4hgspKYPAzu2VATWx3yNGxnssW72Xis4CJhPq4h2EvvyH

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_rush_hour_one_move_sft_new

Jan 2026

hmdmahdaviWarm4B32K

olympiad-curated-qwen3-4b-thinking-generator-critique-7-epoch

Jan 2026

hkust-nlpWarm2B32K

Laser-DE-L4096-1.5B

May 2025

cforge42Warm4B32K

qwen-4b-test

Jan 2026

ibrahimenesduranWarm8B8K

Finfluencer-8B

Jan 2026

wetherbeepWarm14B32K

affine_h1_5FADnMAcCVQvKH9wM8odQY3E2zxS6TJ6ad1a3mna9ws6adrG

Jan 2026

hkust-nlpWarm2B32K

Laser-D-L2048-1.5B

May 2025

teetoneWarm2B32K

OpenR1-Distill-Qwen3-1.7B-Math

Jan 2026

Zachary1150Warm2B32K

math_merge_linear_1.5B

Jan 2026

sangerno63Warm8B32K

affine-5FCJpxFbwsLbujy89cYAHzEUHBPem5xvPHHa6VHvX5xRHyZ6

Jan 2026

JetBrains-ResearchWarm14B32K

Qwen3-14B-am

May 2025

JetBrains-ResearchWarm32B32K

Qwen3-32B-am

May 2025

duckknowsAIWarm4B32K

affine-HyperMotard-5HirFwmY5XSXBst2YSTfPTMiTvNJDZqc5WvHQrPXtRYdVE7Z

Jan 2026

roy-0309Warm14B32K

Affine-1-5FNbAdWA9umLzLTpFwfsfybcEfS66jdcWoJTVhsJL6SXxofZ

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_rush_hour_multi_move_final

Jan 2026

henilp105Warm8B32K

InjecAgent-Llama-3.1-8B-Instruct-optim-5

Nov 2024

henilp105Warm8B32K

InjecAgent-Llama-3.1-8B-Instruct-optim-10

Nov 2024

yufeng1Warm8B32K

R1-Distill-Qwen-7B-reasoning-full-lora-type3-e5

Oct 2025

hmdmahdaviWarm4B32K

olympiad-curated-qwen3-4b-thinking-distill-30b

Jan 2026

asingh15Warm4B32K

rl-4b-arc-abstractions-judge-unnorm-mult-no-thinking-max2k-0120-step90

Jan 2026

koutchWarm8B32K

paper_llama_llama3.1-8b_train_sft_train_para

Jan 2026

rrvaswinWarm1B32K

64_v1_scalable

Jan 2026

yufeng1Warm8B32K

R1-Distill-Qwen-7B-type6-e5-alpha0_625

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_new_sudoku_one_action_A_sft_lr_5e_6__step_1686

Jan 2026

yurunyyrWarm3B32K

agentic-sudoku-NoStateTrans_qwen2.5-3B-5e-6_gt-SFT_ans1-24k

Jan 2026

DeeWooWarm7B4K

Llama-2-7b-chat_FFT_GSM8K

Dec 2024

dondongwonleeWarm7B4K

GELI

Nov 2024

wuqiong1Warm7B4K

PA-RAG_Llama-2-7b-chat-hf

Mar 2025

CharlesLiWarm7B4K

llama2_openo1_safe_o1_4o_reflect_4000_1000_full

Mar 2025

Tim419Warm7B4K

Humpback_Myx

Apr 2025

CharlesLiWarm7B4K

llama_2_alpaca_llama_2

Dec 2024

CharlesLiWarm7B4K

llama_2_unsafe_llama_2

Dec 2024