Models

2,770

minhtuan7akpWarmTools500M32K

qwen2.5_0.5b_base_scratch_reasoning_finetune

SVECTOR-CORPORATIONWarmTools3B32K

Theta-35-Mini

Apr 2025

jxoptionalWarmTools15B32K

xori-1-14b

Mar 2026

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-verified-scaled-1_stratos_7b

mlfoundations-devWarmTools8B32K

llama3-1_8b_4o_annotated_math

legmlaiWarmTools15B32K

legml-v0.1

Nov 2024

kamelcharafWarmTools3B32K

GRPO-SFT-qwen2.5-3B-qwen2.5-7B-mrd3-s7-sum_token_prompt-merged

razor534WarmTools500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-stocky_nasty_pheasant

Jun 2025

Danau5tinWarmTools3B32K

calculator_agent_qwen2.5_3b

predibaseWarmTools33B32K

Predibase-T2T-32B-RFT

Mar 2025

PeterJinGoWarmTools3B32K

SearchR1-nq_hotpotqa_train-qwen2.5-3b-it-em-ppo-v0.2

Usman391WarmTools3B32K

qwen-3B-stego-2-codes

Jan 2026

Usman391WarmTools3B32K

qwen-3B-stego-no-codes

Jan 2026

reds0510WarmTools3B32K

qwq_mixed_evol8k_aug4k_1e5

Jan 2026

DXCLabWarmTools3B32K

OncoCareBrain-GPT

Mar 2025

Mojo7WarmTools3B32K

Katkut-3B

Feb 2026

PeterJinGoWarmTools3B32K

SearchR1-nq_hotpotqa_train-qwen2.5-3b-it-em-grpo-v0.3

May 2025

archiiiiWarmTools3B32K

medical-qwen-315

Mar 2026

ogulcanaydoganWarmTools33B32K

Turkish-LLM-32B-Instruct

Mar 2026

mlfoundations-devWarmTools33B32K

DCFT-Stratos-Unverified-114k-32B

mlfoundations-devWarmTools8B32K

stratos-unverified-mix-scaled-1

minhtuan7akpWarmTools500M32K

qwen2.5_0.5b_base_qa_finetune_v3

dulguun222WarmTools3B32K

qwen_3b_math

p2g3ads4WarmTools500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-camouflaged_tame_alpaca

cryptobrosWarmTools500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-endangered_burrowing_sealion

Silin1590WarmTools8B32K

Qwen-7B-Int-CoT

yrshiWarmTools3B32K

AutoRefine-Qwen2.5-3B-Instruct

linxyWarmTools15B32K

RETuning-DeepSeek_R1_14B_SFT_GRPO

philipperen55WarmTools15B32K

Qwen2.5-14B-style-MERGED-v3-BF16

Dec 2025

webbigdataWarmTools3B32K

FanFic-Illustrator

Mar 2025

yurunyyrWarmTools3B32K

agentic-futoshiki-NoStateTrans_qwen2.5-3B-5e-6_gt-SFT_20k

Jan 2026

ray0rf1reWarmTools3B32K

Nix2.5-plus

Jan 2026

PhonsiriWarmTools3B32K

Qwen2.5-3B-Math-Distilled

Feb 2026

yzxjbWarmTools3B32K

RL-PW0.6-Qwen2.5-Decision-step20

Mar 2026

long-horizon-reasoningWarmTools3B32K

Qwen-3b-GRPO-len-5

Sep 2025

LegendaryDawnWarmTools3B32K

SDRL-icml_rebuttal-freq-Qwen2.5-3B-majority_n8_l2048-DAPO_n8_bs256_long8-step200

Mar 2026

mlfoundations-devWarmTools8B32K

DCFT-Stratos-Verified-114k-7B-4gpus

mlfoundations-devWarmTools8B32K

oh-dcft-v3.1-claude-3-5-sonnet-20241022-qwen

mlfoundations-devWarmTools8B32K

llama3-1_8b_4o_annotated_aops

mlfoundations-devWarmTools8B32K

s1K_reformat

mlfoundations-devWarmTools8B32K

difficulty_sorting_easy_seed_math

Feb 2025

mlfoundations-devWarmTools8B32K

stratos_verified_plus_s1r1