Models

14,755

MultiRLWarm2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_1184

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_296

Jan 2026

huseyinatahaninanWarm8B32K

appworld_distillation_sft_v2-SFT-Qwen3-8B

Jan 2026

ThrillcrazyerWarm8B32K

Qwen-7B_TAC_RLOO

Jan 2026

dogknowsAIWarm4B32K

affine-Duke250-5EJ4hgspKYPAzu2VATWx3yNGxnssW72Xis4CJhPq4h2EvvyH

Jan 2026

hkust-nlpWarm2B32K

Laser-DE-L4096-1.5B

May 2025

benstafWarm8B8K

pitinf_8b_identity-merged

Jan 2026

ibrahimenesduranWarm8B8K

Finfluencer-8B

Jan 2026

wetherbeepWarm14B32K

affine_h1_5FADnMAcCVQvKH9wM8odQY3E2zxS6TJ6ad1a3mna9ws6adrG

Jan 2026

hkust-nlpWarm2B32K

Laser-D-L2048-1.5B

May 2025

agsidd10Warm1B32K

llama-1b-sft-tldr

Sep 2025

teetoneWarm2B32K

OpenR1-Distill-Qwen3-1.7B-Math

Jan 2026

Zachary1150Warm2B32K

math_merge_linear_1.5B

Jan 2026

sangerno63Warm8B32K

affine-5FCJpxFbwsLbujy89cYAHzEUHBPem5xvPHHa6VHvX5xRHyZ6

Jan 2026

JetBrains-ResearchWarm14B32K

Qwen3-14B-am

May 2025

JetBrains-ResearchWarm32B32K

Qwen3-32B-am

May 2025

roy-0309Warm14B32K

Affine-1-5FNbAdWA9umLzLTpFwfsfybcEfS66jdcWoJTVhsJL6SXxofZ

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_rush_hour_multi_move_final

Jan 2026

henilp105Warm8B32K

InjecAgent-Llama-3.1-8B-Instruct-optim-5

Nov 2024

henilp105Warm8B32K

InjecAgent-Llama-3.1-8B-Instruct-optim-10

Nov 2024

hmdmahdaviWarm4B32K

olympiad-curated-qwen3-4b-thinking-distill-30b

Jan 2026

rrvaswinWarm1B32K

64_v1_scalable

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_new_sudoku_one_action_A_sft_lr_5e_6__step_1686

Jan 2026

yurunyyrWarm3B32K

agentic-sudoku-NoStateTrans_qwen2.5-3B-5e-6_gt-SFT_ans1-24k

Jan 2026

JameSandWarm2B32K

qwen3-1.7b-base-adam-3e-6-bs128-kl0.0-global_step_200

Jan 2026

dondongwonleeWarm7B4K

GELI

Nov 2024

wuqiong1Warm7B4K

PA-RAG_Llama-2-7b-chat-hf

Mar 2025

CharlesLiWarm7B4K

llama_2_gsm8k_cot_simplest

Jan 2025

CharlesLiWarm7B4K

llama2_openo1_safe_o1_4o_reflect_4000_1000_full

Mar 2025

Tim419Warm7B4K

Humpback_Myx

Apr 2025

CharlesLiWarm7B4K

llama_2_alpaca_llama_2

Dec 2024

CharlesLiWarm7B4K

llama_2_unsafe_llama_2

Dec 2024

jaeyong2Warm500M32K

Qwen2.5-0.5B-Instruct-Thai-SFT

Oct 2024

TianqiLiuAIWarm3B8K

RRM-gemma2-2b

Nov 2024

allknowingrogerWarm8B32K

LlamaSlerp1-8B

Nov 2024

Shiyu-LabWarm2B32K

DeepScaleR-1.5B-Preview-thinkprune-4k

Apr 2025

ozgecanaktasWarm1B2K

tinyllama-itinerary-final

May 2025

willcbWarm500M32K

Qwen2.5-0.5B-Reverse-SFT

May 2025

and-emiliWarm4B32K

aera-4b

May 2025

liushiliushiWarm8B32K

ConfTuner-LLaMA

Jun 2025

northWarm3B32K

north_llama32_3b_enhancedNCC_instruct_v1_long_lr2e6_2048_160000

Jul 2025

MhairWarm1B2K

Jul 2025