Models

2,770

mlfoundations-devWarmTools8B32K

seed_math_multiple_samples_scale_up_scaredy_cat_test

Feb 2025

mlfoundations-devWarmTools8B32K

stratos_pdf_science_questions__unverified__v1

chenggong1995WarmTools8B32K

Qwen-2.5-Base-7B-mixed-gen14

mlfoundations-devWarmTools8B32K

bespokelabs_Bespoke-Stratos-17k_Qwen_Qwen2.5-7B-Instruct_reasoning

dillonknWarmTools500M32K

qwen2.5-0.5b-reasoning-sft

johnnyd-gensynWarmTools2B32K

Qwen2.5-1.5B-Instruct-Gensyn-Swarm-spotted_regal_toad

duchao1210WarmTools3B32K

qwen2.5-3b-scratch_11e_kmap

baryenWarmTools500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-beaked_nasty_dolphin

gosrakWarmTools500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-feathered_wiry_deer

heizigeWarmTools3B32K

Qwen2.5-Social-3B-NB-Chat

JuliaP-0419WarmTools3B32K

Qwen2.5-3B_anti-ai_en

May 2025

AlexanderWang915WarmTools3B32K

qwen2.5-3b-moloptins

Aug 2025

LegendaryDawnWarmTools3B32K

erpo-iclr-baseline-Qwen2.5-3B-dapo

Oct 2025

yuzhounieWarmTools33B32K

sft_qwen32b

Jan 2026

yurunyyrWarmTools3B32K

agentic-sokoban-qwen2.5-3B_SAS_SFT

Jan 2026

yurunyyrWarmTools3B32K

agentic-futoshiki-qwen2.5-3B_SAS_SFT

Jan 2026

reds0510WarmTools3B32K

nvidia_qwq_aug_1e5

Jan 2026

reds0510WarmTools3B32K

mixed_set1_correct_12k_ep10

Jan 2026

t2anceWarmTools3B32K

SFT-Warmup-3B

Jan 2026

staeiouWarmTools3B32K

bartleby-qwen2.5-3b

Jan 2026

uzi-9WarmTools3B32K

dl_finetuned_minicoder

Nov 2025

SWY666WarmTools3B32K

GRPO_Best13_double

Apr 2025

Rakancorle1WarmTools3B32K

qwen2.5-3b_Instruct_policy_traj_30k_full

Sep 2025

swordliWarmTools3B32K

Qwen2.5-3B-Base-SAPO

Mar 2026

LegendaryDawnWarmTools3B32K

SDRL-icml_rebuttal-2turn-freq-Qwen2.5-3B-majority_n4_l2048-DAPO_n8_bs256_long8-step200

Mar 2026

mlfoundations-devWarmTools8B32K

oh-dcft-v3.1-llama-3.1-405b-qwen-v2dummytesting

mlfoundations-devWarmTools33B32K

DCFT-Stratos-Verified-114k-32B-4gpus

Jan 2025

mlfoundations-devWarmTools8B32K

llama3-1_8b_4o_annotated_aime

mlfoundations-devWarmTools8B32K

llama3-1_8b_r1_annotated_aime

mlfoundations-devWarmTools8B32K

distill_70b_infra_together

mlfoundations-devWarmTools8B32K

multiple_samples_none_numina_aime

mlfoundations-devWarmTools8B32K

LIMO

mlfoundations-devWarmTools8B32K

s1K_reformat_v2

mlfoundations-devWarmTools8B32K

qwen2-5_sky_t1_2-5k_alternative_r1_distill_llama70b

mlfoundations-devWarmTools8B32K

qwen2-5_sky_t1_2-5k_rewrite_r1_distill_llama70b

mlfoundations-devWarmTools8B32K

llama3-1_8b_gsmyrnis_test_dpo_data

dekangliWarmTools2B32K

Qwen2.5-1.5B-SFT-v2

helenkoWarmTools500M32K

medical_SFT_ko_model

mlfoundations-devWarmTools8B32K

openthoughts3_science

mlfoundations-devWarmTools8B32K

openthoughts3_30k

finvixWarmTools500M32K

qwen-2.5-0.5B

mlfoundations-devWarmTools8B32K

Qwen2.5-7B-Instruct_qwq_mix_r1_science