Models

40,530

EtashGuhaColdTools32B32K

gptlong_continue_nemotron_terminal_step1500__Qwen3-32B

May 2026

RUNE-CTZColdTools32B32K

affine-5EU1ML8Kzh5mdHpmbRbn6v8eRPM9F8pyz1YrvD5VwbdZ8g3x

May 2026

sibasmarakpColdTools2B32K

Qwen3-1.7B-Wordle-SFT

May 2026

EtashGuhaColdTools32B32K

gptlong_continue_nemotron_terminal_step2700__Qwen3-32B

May 2026

BetswishColdTools8B32K

seed0_bmlama_Qwen-Qwen2.5-7B-Instruct_multi_0.1_MAPO_5e-06

May 2026

zhaohqColdTools2B32K

RLCR-1.5B-hotpot-rac-lr5e6

May 2026

Enthusiast101ColdTools3B32K

Llama-3.2-3B-Instruct-hhrlhf

May 2026

flammenaiColdTools7B4K

flammen9-mistral-7B

Mar 2024

lzq677Cold7B4K

GeoCode-GPT

Jun 2025

distillgptColdTools32B32K

Affine-5ECFPTFqojMnEB6z881mJzrXLREvkEnj1wcu37zz4223Ln9x

May 2026

Jihyung803ColdTools8B32K

Qwen3-8B-PragReST-FullFT3

May 2026

hjshColdTools2B32K

qwen2.5_math_1.5b_grpo_rollout_8_w_o_KL_step450

May 2026

hjshColdTools2B32K

qwen2.5_math_1.5b_grpo_prob_adv_scaled_ratio_w_o_kl_step580

May 2026

hjshColdTools2B32K

qwen2.5_math_1.5b_grpo_prob_adv_scaled_ratio_w_o_kl_step200

May 2026

hjshColdTools2B32K

qwen2.5_math_1.5b_grpo_prob_adv_scaled_ratio_w_o_kl_step350

May 2026

zeras141aCold1B2K

083fff31

Aug 2025

hjshColdTools2B32K

qwen2.5_math_1.5b_grpo_rollout_8_w_o_KL_step150

May 2026

parkjoColdTools8B32K

Qwen2.5-Math-7B_grpo_base_step580

Apr 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6c1-distill-lam01-maskoff

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v9G-digit-w200

May 2026

Antonio88ColdTools7B4K

TaliML-7B-ITA-V.1.0.FINAL

Mar 2024

UigyuCold42B32K

RASA-all3-Phi-3.5-MoE-instruct

May 2026

cheongmyeong17ColdTools2B32K

Qwen2.5-MATH-1.5B-GRPO-Best

Jul 2025

CorrectKLinRLColdTools2B32K

Qwen3-1.7B-Base-prlCurrentKL-eta100-forward_k3-clipLow_inf-clipHigh_inf

May 2026

vitaleantonioColdTools2B32K

Qwen2.5-Coder-CONTROL-MCEVALHARD-1.5B-Base-10

May 2026

vitaleantonioColdTools2B32K

Qwen2.5-Coder-CONTROL-MCEVALHARD-1.5B-Base-4

May 2026

Geon10102ColdTools1B32K

assn2-simpo-llama32-1b

May 2026

vitaleantonioColdTools2B32K

Qwen2.5-Coder-CONTROL-MCEVALHARD-1.5B-Base-1

May 2026

penginlabsColdTools2B32K

YOLO-Coder-1.5B

May 2026

ikimyaiiCold7B4K

llama-7b-awp-70pct

May 2026

wvnvwnCold9B16K

gemma-2-9b-it-gsm8k-rsn-tuned-lr1e-5

May 2026

kmseongCold7B4K

llama-2-7b-chat-hf-arc-sn-tuned-lr5e-5

May 2026

Enthusiast101ColdTools1B32K

llama3.2-1b-Inst-arithmetic

May 2026

kmseongCold7B4K

Llama-2-7b-chat-hf_gsm8k_ft_freeze_basis_rotation_rsn_lr5e-5

May 2026

prexpertColdTools32B32K

affine-128-5EPRVWjLkEHNxuzYa2vVdD6oxx4o9FJQ2hk7uSnLK5UPdWsz

May 2026

kmseongColdTools8B32K

llama3.1-8B_base_gsm8k_ft_freeze_rsn_lr1e-5

May 2026

RUNE-CTZColdTools32B32K

affine-5Cr3BwgBMC9JuFyGJL9vDSarBs3tD1TYWMXnGMvSJ2u1jhSu

May 2026

wvnvwnColdTools7B4K

Mistral-7B-Instruct-v0.3-spider-cabs-A-v1

May 2026

miolgCold1B2K

4e5fcabb

Aug 2025

jiogenesCold9B16K

gemma-2-9b-r256-svd-qres1

May 2026

jiogenesCold9B16K

gemma-2-9b-r1024-svd-qres4

May 2026

jiogenesCold9B16K

gemma-2-9b-r128-svd-qres8

May 2026