Models

7,348

shengjia-torontoColdTools2B32K

sac-gspo-cl3e3-drgrpo-qwen25-math-1.5b-step1500

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-l2-kl-w1-b0

May 2026

Mytho0610ColdTools2B32K

LLMMachineTranslation

May 2026

pltopsColdTools8B32K

Qwen2-7B-Instruct-dis-wspo-oasst2

May 2026

mlfoundations-devColdTools8B32K

llama3-1_8b_r1_annotated_aops

soul7402ColdTools14B32K

qwen-14b

AlexCuadronColdTools32B32K

DSR1-Qwen-32B-DSR1-Qwen-32B-131fad2c

moogicianColdTools32B32K

DSR1-Qwen-32B-still

aXsalllColdTools500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-opaque_nasty_meerkat

rockst4r4ColdTools500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-wiry_arctic_alpaca

haihp02ColdTools500M32K

hand_tuned-84ea0347-fd7d-449d-a9b9-513c3c149419

Ayush-SinghColdTools500M32K

Qwen-0.5B-SFT

ybq0509ColdTools32B32K

mo_Q_32B_ckpt1124

ybq0509ColdTools14B32K

mo_Q_14B_ckpt2250

ybq0509ColdTools32B32K

sc_Q_32B_ckpt1124

OpenPipeColdTools14B32K

codenames-14b-sft

bekmnsrwColdTools14B32K

ComposePerformanceModel

Lucien520ColdTools2B32K

Qwen2.5-1.5B-Open-R1-GRPO

Dec 2025

zeynebnkColdTools8B32K

qwen7b_bcb_grpo_step60

Jan 2026

ubowangColdTools8B32K

fim_qwen25_coder_7b_ins_0105_r2egym_sft_0108-ckpt_808

Jan 2026

ericksoaColdTools8B32K

chess-v6-rs-v2

Jan 2026

usr256864ColdTools8B32K

ee_qw7_grpo

Jan 2026

hkust-nlpColdTools8B32K

Laser-D-L4096-7B

May 2025

jastorjColdTools8B32K

snowflake_arctic_text2sql_r1_7b-nl2sqlpp-16bit-v5.1-cw-15K

Jan 2026

zeynebnkColdTools8B32K

ws_0.01_60

Jan 2026

mlfoundations-devColdTools8B32K

b2_science_fasttext_pos_scp116k

Apr 2025

m-a-pColdTools8B32K

CriticLeanGPT-Qwen2.5-7B-Instruct-SFT-RL

Jul 2025

m-a-pColdTools8B32K

TreePO-Qwen2.5-7B_Low_Prob_Encourage

Sep 2025

zjhhhhColdTools8B32K

7b_iter2_multi_0.17_eta_1e4_step_322_final

Dec 2025

ThrillcrazyerColdTools8B32K

Qwen-7B_NOTAC_PPO

Jan 2026

zeynebnkColdTools8B32K

qwen7b_bcb_grpo_step40

Jan 2026

ThrillcrazyerColdTools8B32K

Qwen-7B_NOTAC_GSPO

Jan 2026

zeynebnkColdTools8B32K

qwen7b_bcb_grpo_step120

Jan 2026

ThrillcrazyerColdTools8B32K

Qwen-7B_TAC_GRPO

Jan 2026

pittawatColdTools8B32K

rl-scaling-sft-qwen-2.5-7b-instruct

Jan 2026

HahmdongColdTools8B32K

AT-qwen2.5-7b-hhrlhf-5120-sft-b3s3-tesla-ver13

Jan 2026

zeynebnkColdTools8B32K

qwen7b_kodcode_grpo_step60

Jan 2026

zeynebnkColdTools8B32K

qwen7b_kodcode_grpo_step80

Jan 2026

zeynebnkColdTools8B32K

qwen7b_kodcode_grpo_step100

Jan 2026

synthetic-code-trainingColdTools8B32K

qwen25-coder-7b-dependency-qwen235-500i-5e-0-00005lr-bs8-bf16

Jan 2026

pittawatColdTools8B32K

rl-scaling-rft-qwen-2.5-7b-instruct-grpo-baseline

Jan 2026

dc0604ColdTools8B32K

tooluse-qwen7b-step200

Jan 2026