Models

8,681

laionWarmTools8B32K

r2egym-nl2bash-stack-bugsseq

Dec 2025

weirekWarmTools4B32K

affine-new-1

SeongyunWarmTools4B32K

qwen3-4b-thinking-rl-ckpt-109

Dec 2025

laionWarmTools8B32K

nl2bash-swesmith-stack-bugsseq

Dec 2025

MultiRLWarmTools2B32K

qwen3_1.7b_easy_rl_final_step120

Dec 2025

MultiRLWarmTools4B32K

qwen3_4b_sft_new

wls04WarmTools2B32K

qwen3-warmup-sft

Dec 2025

DevopsEmbraceWarmTools32B32K

qwen3_32B_sft_IV_e1_unsloth_base_qwen_merged_16bit

laionWarmTools8B32K

swesmith-nl2bash-stack-bugsseq

Dec 2025

MultiRLWarmTools2B32K

qwen3_1.7b_easy_rl_final_gamma_1

Dec 2025

kianvuongWarmTools2B32K

htktai2025-merged-model-v6

Dec 2025

koutchWarmTools4B32K

qwen3-thinking-4b_train_sft_train_no_think

Dec 2025

koutchWarmTools4B32K

qwen3-instruct-4b_train_sft_train_no_think

Dec 2025

willamazon1WarmTools4B32K

Qwen3-4B-rft-alfworld-e1

Dec 2025

HallDWarmTools4B32K

SkeptiSTEM-4B-v2-stageR1-merged-16bit

Dec 2025

sagnikMWarmTools2B32K

ppo_sgd_qwen3_1.7b_1e-2

Dec 2025

WebScraper991923WarmTools4B32K

Affine-Miracle

JRohnerWarmTools4B32K

affine-forward00

Dec 2025

NorraweeWarmTools4B32K

Qwen3-4B-Thinking-2507-exp02

Jan 2026

staeiouWarmTools800M32K

bartleby-qwen3-0.6b

Jan 2026

Ruzel23WarmTools800M32K

Qwen3-0.6B-Gensyn-Swarm-mangy_hunting_raven

Aug 2025

EdmondMillionWarmTools4B32K

affine-e

Jan 2026

AIPlansWarmTools800M32K

Qwen3-HHH-Cipher-Eng

Jun 2025

DuckyBlenderWarmTools800M32K

diegogpt-v2-mlx-bf16

Jul 2025

CooolderWarmTools4B32K

SCOPE-CoT-sft-v2

Jan 2026

AlexNG01WarmTools4B32K

Affine_bee302

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_1776

Jan 2026

RexhaifWarmTools800M32K

Mlem-0.6B-RL

Jan 2026

ATL-MachineWarmTools4B32K

affine-1-5ETyoog2ttXGSu5UhxhrLtjdL1BSbo2SeELdFAp1YBimQuq9

Jan 2026

hmdmahdaviWarmTools4B32K

olympiad-curated-qwen3-4b-thinking-distill-30b

Jan 2026

alexHeiheiWarmTools4B32K

affine-pua3-5EKwUe6ab5Zc89r7ond8MjC29YShSS64gsmQ8ne4QAVNeQyA

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_one_action_easy_11_20_epoch3

Jan 2026

qingy2024WarmTools2B32K

Formatter-1.7B

May 2025

yujiangwWarmTools2B32K

Qwen3-1.7B-GRPO

Jul 2025

Yale-ROSEWarmTools4B32K

Qwen3-4B-sft_dataset_gpt-sft-trl-v2

Sep 2025

RMCianWarmTools800M32K

Qwen3-0.6B-Gensyn-Swarm-fast_rabid_ram

Aug 2025

abcorreaWarmTools4B32K

struct-v1

Nov 2025

viamr-projectWarmTools2B32K

qwen3-1.7b-amr-20260124-0130

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_easy_rl_reinforce_ori

Dec 2025

jpacificoWarmTools4B32K

Qwen3-4B-Instruct-DPO-test2

Dec 2025

MultiRLWarmTools2B32K

qwen3_1.7b_new_sudoku_one_action_A_sft_lr_5e_6__step_2248

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_sudoku_one_action_A_sft_lr_5e_6__step_562

Jan 2026