Models

20,703

PranavzColdTools26B32K

gemma-4-26B-A4B-it-arli-v2

May 2026

jas1k1ColdTools27B32K

Jnotworkingv17t

May 2026

razor534ColdTools500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-stocky_nasty_pheasant

Jun 2025

embedlCold1B32K

gemma-3-1b-it-FlashHead

Dec 2025

kqu5ColdTools2B32K

Emory-CS557-AI-Final-Test

Dec 2025

TMLR-Group-HFColdTools2B32K

GT-Qwen3-1.7B-Base-MATH

Aug 2025

ncaagccCold1B2K

828e3b1d

Aug 2025

ncaagccCold1B2K

naz2

Sep 2025

RazielGuinhosColdTools1B32K

raccoon

Sep 2025

realtreetuneColdTools2B32K

delethink-96k-ckpt150

Sep 2025

YangZhoumillColdTools4B32K

multiple_models_qwen3_4B_step260

Nov 2025

SeongyunColdTools4B32K

qwen3-4b-thinking-rare-ckpt-109

Dec 2025

MultiRLColdTools4B32K

qwen3_4b_easy_rl_final

Dec 2025

MultiRLColdTools2B32K

qwen3_1.7b_easy_rl_final

Dec 2025

MultiRLColdTools2B32K

qwen3_1.7b_sft_one_act

Dec 2025

MultiRLColdTools4B32K

qwen3_4b_medium_rl_final

Dec 2025

Zachary1150ColdTools2B32K

expert_len_MRL4096_ROLLOUT4_LR5e-7_step30

Dec 2025

roy-0309ColdTools4B32K

Affine-v1

Dec 2025

CheeeeeeeekyColdTools4B32K

Affine-5HWFHBJk9TU4FEnuyDJoVEUHH3PyorgXkMx3jRtMeUcPwWPA

Dec 2025

ahme0599ColdTools2B32K

Qwen_Qwen2.5-1.5B-Instruct-GRPO-vanilla_G_4-checkpoint-510

Dec 2025

chess99iColdTools4B32K

Affine-CR7

Dec 2025

Zachary1150ColdTools2B32K

merge_accfmt_MRL4096_ROLLOUT4_LR2e-6_w0.9_linear

Dec 2025

Usman391ColdTools3B32K

qwen-3B-stego-2-codes

Jan 2026

Usman391ColdTools3B32K

qwen-3B-stego-no-codes

Jan 2026

MultiRLColdTools2B32K

qwen3_1.7b_easy_rl_ours_adv_fixed_geo_ms_seq_is_epoch3

Jan 2026

AlignmentResearchColdTools70B32K

hr_hand_crafted_Llama-3.3-70B_medium_15_epochs_merged_v4

Jan 2026

MultiRLColdTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_6__global_step_888

Jan 2026

TeichAIColdTools8B32K

Qwen3-8B-Gemini-3-Pro-Preview-Distill

Nov 2025

MLInAiCold4B4K

phi3_equipment-tuned-qlora

Dec 2025

MultiRLColdTools2B32K

qwen3_1.7b_new_sudoku_one_action_new_sft_lr_5e_6

Jan 2026

Dogoo3ColdTools12B32K

Aletheia-12B

Jan 2026

zzwkkColdTools32B32K

MUA-RL-32B

Aug 2025

zzwkkColdTools14B32K

MUA-RL-14B

Aug 2025

MultiRLColdTools2B32K

qwen3_1.7b_sudoku_multi_action_sft_final

Jan 2026

blacksimon818ColdTools4B32K

run0118-local-reasoning-obo-0_5-baseline-max32-step49

Jan 2026

MultiRLColdTools2B32K

qwen3_1.7b_sudoku_one_action_easy_11_20

Jan 2026

MultiRLColdTools2B32K

qwen3_1.7b_new_sudoku_one_action_A_sft_lr_5e_6__step_1124

Jan 2026

MultiRLColdTools2B32K

qwen3_1.7b_new_sudoku_one_action_A_sft_lr_5e_6__step_1686

Jan 2026

facebookColdTools8B32K

meta-wiki-expert

Aug 2025

laionColdTools8B32K

Qwen3-8B_exp_tas_temp_0.5_traces_save-strategy_steps

Jan 2026

Muhammadaqib12Cold1B2K

AB2

Oct 2025

Aletheia-BenchColdTools15B32K

GRPO-Think-14B-16k

Nov 2025