Models

16,065

Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step0

0

·

2

·

Mar 2026

Anonymous-2004WarmTools2B32K

asgn2-model_sft_dare

0

·

2

·

Mar 2026

Anonymous-2004WarmTools2B32K

asgn2-model_harmful_lora

0

·

2

·

Mar 2026

rohan2810WarmTools4B32K

NEW_BASELINE_SFT_hotpotqa_Qwen3-4B-Instruct

0

·

2

·

Mar 2026

Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step2000

0

·

2

·

Mar 2026

joaosollatoriWarmTools500M32K

tita-sft

0

·

2

·

Mar 2026

Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step2500

0

·

2

·

Mar 2026

Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step3500

0

·

2

·

Mar 2026

Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step4000

0

·

2

·

Mar 2026

Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step7000

0

·

2

·

Mar 2026

Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step8000

0

·

2

·

Mar 2026

PetarKalWarmTools4B32K

Qwen3-4B-Base-ascii-art-v5-e3-lr5e-5-ga16-ctx4096

0

·

2

·

Mar 2026

i99omWarm3B2K

phi-2

0

·

2

·

Jul 2025

eunhyangWarmTools2B32K

Qwen3-1.7B-base-MED

0

·

2

·

Mar 2026

oof-baroomfWarmTools4B32K

csrsef-thinking-20260325T021216Z-it01-pubmedqa

0

·

2

·

Mar 2026

senicyWarmTools500M32K

day1-train-model

0

·

2

·

Mar 2026

czphusWarmTools500M32K

day1-train-model

0

·

2

·

Mar 2026

kick1127WarmTools500M32K

day1-train-model

0

·

2

·

Mar 2026

bkbogusWarmTools500M32K

day1-train-model

0

·

2

·

Mar 2026

zzaenWarmTools500M32K

day1-train-model

0

·

2

·

Mar 2026

beuuettWarmTools500M32K

day1-train-model

0

·

2

·

Mar 2026

elonakerisyntaxsquadWarmTools2B32K

plant-classifier

0

·

2

·

Mar 2026

xw1234ganWarmTools3B32K

Main_fixed_MATH_3B_step_2

0

·

2

·

Mar 2026

volosatiWarmTools4B32K

Jan-v1-4B

0

·

2

·

Mar 2026

xw1234ganWarmTools3B32K

Main_fixed_MATH_3B_step_9

0

·

2

·

Mar 2026

DotalixWarmTools3B32K

Qwen2.5-3B-hereticc

0

·

2

·

Mar 2026

MultiRLWarmTools4B32K

qwen3_4b_sudoku_one_act_rl_default_epoch2

0

·

2

·

Mar 2026

siddhartha37msWarmTools3B32K

contract-analyzer-legal

0

·

2

·

Mar 2026

BRlklWarmTools4B32K

distill-sft-qwen3-4b-full

0

·

2

·

Mar 2026

nirajan10WarmTools2B32K

qwen2.5-1.5b-quotes-merged

0

·

2

·

Mar 2026

xw1234ganWarmTools3B32K

Main_MATH_3B_step_1

0

·

2

·

Mar 2026

j05hr3dWarmTools3B32K

Llama-3.2-3B-Instruct-C_M_T-SAM_RHO0_02

0

·

2

·

Mar 2026

j05hr3dWarmTools3B32K

Llama-3.2-3B-Instruct-C_M_T-SAM_RHO0_02-AUX_CT_CE

0

·

2

·

Mar 2026

xw1234ganWarmTools3B32K

Main_MATH_3B_step_2

0

·

2

·

Mar 2026

ramgopal-reddyWarmTools800M32K

qwen-law-model

0

·

2

·

Mar 2026

MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_epoch2

0

·

2

·

Mar 2026

lhkhiem28WarmTools1B32K

Llama-3.2-1B-MATH-A9-U-GRPO

0

·

2

·

Mar 2026

rajveer43WarmTools2B32K

supply-chain-grpo-Qwen3-1.7B

0

·

2

·

Mar 2026

sundulenWarmTools500M32K

Belajar

0

·

2

·

Mar 2026

xw1234ganWarmTools3B32K

Main_MATH_3B_step_5

0

·

2

·

Mar 2026

MultiRLWarmTools2B32K

qwen3_1.7b_webshop_macro_action_epoch3

0

·

2

·

Mar 2026

sagnikMWarmTools2B32K

grpo_adam_small_beta

0

·

2

·

Mar 2026