Models

16,109

NorraweeWarmTools4B32K

Qwen3-4B-Thinking-2507-GRPO-exp03

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_sudoku_one_action_C_sft_lr_5e_6__step_1668

Jan 2026

LuthfillahWarmTools4B32K

lora_model_qwen3_kaggle_2_epoch

Jan 2026

Mahesh111000WarmTools4B32K

qwen-hanabi-merged

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_new_sudoku_one_action_C_sft_lr_5e_6__step_6672

Jan 2026

capheWarmTools4B32K

Affine-9000

Jan 2026

neosknightWarmTools3B32K

Llama3B-Cot

Jan 2026

HerrHrubyWarmTools4B32K

online_acemath_rl_4b_inst_hard_16k_self_verify_step_100

Jan 2026

penvaWarmTools4B32K

affine-aaa

Jan 2026

reds0510WarmTools3B32K

qwq_mixed_evol8k_aug4k_1e5

Jan 2026

MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_multi_action_easy_11_20_epoch1

Jan 2026

HallDWarmTools4B32K

SkeptiSTEM-4B-v2-R123-fully-merged-16bit

Jan 2026

asingh15WarmTools4B32K

arc-abs-sft-no-oracle-lr5e-6-ep1-0104

Jan 2026

GreatGooseWarmTools500M32K

Qwen2.5-0.5B-Instruct-distill-3epoch

Jan 2026

koutchWarmTools4B32K

short_paper_qwen_0.json_train_dpo_v1_dev

Jan 2026

rrvaswinWarmTools3B32K

4b_SFT_NEW

Jan 2026

guru-0430WarmTools4B32K

Affine-first

Jan 2026

sharon9018WarmTools4B32K

affine-update-27

Jan 2026

bennett-tanWarm4B32K

phi-4-mini-instruct-merged

Jan 2026

Prat78WarmTools1B32K

StudyAiv19

Jan 2026

Kazuki1450WarmTools2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-9_1p0_0p0_1p0_grpo_1_rule

Jan 2026

Kazuki1450WarmTools2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-9_1p0_0p0_1p0_grpo_2_rule

Jan 2026

viiiikingWarmTools800M32K

ckpt

Jan 2026

HuggingfaceSharanyaWarmTools4B32K

qwen-recipe-mergedv8

Jan 2026

akhil-duaWarmTools1B32K

llama-3.2-1b-redteam_ift

Jan 2026

koutchWarmTools4B32K

paper_qwen_qwen3-instruct-4b_train_sft_train_para

Jan 2026

wls04WarmTools4B32K

qwen3_4B_DAPO_OPD_SKD_fin

Jan 2026

gjyotin305WarmTools3B32K

Llama-3.2-3B-Instruct_old_sft_alpaca_005

Jan 2026

gjyotin305WarmTools3B32K

Llama-3.2-3B-Instruct_old_sft_alpaca_003

Jan 2026

sachiniyerWarmTools500M32K

Qwen2.5-0.5B-DPO-Schwinn

Jan 2026

osolaWarmTools4B32K

Affine-h06

Jan 2026

yurunyyrWarmTools3B32K

agentic-futoshiki-NonMarkov_qwen2.5-3B-5e-6_gt-SFT_20k

Jan 2026

yurunyWarmTools4B32K

agentic-sudoku-NonMarkov_qwen3-4B-5e-6_9x9_6-6_gt-SFT_ans1-4k

Jan 2026

jackf857WarmTools1B32K

Llama32-1b-Instruct-hh-sft-30

Jan 2026

yurunyWarmTools3B32K

agentic-futoshiki-Markov_qwen2.5-3B-5e-6_gt-SFT_10k

Jan 2026

Kazuki1450WarmTools2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-7_1p0_0p0_1p0_grpo_2_rule

Jan 2026

harisarangWarmTools800M32K

Qwen3-0.6B-Reverse-Text-RL

Jan 2026

Umesh1212Warm1B2K

k8s-phi3-vllm

Jan 2026

vincentwarriorWarmTools4B32K

affine-5HSmJpVjxofnwa7EtuoGyic2aSWKYaCQf6qADLc7ytNdfJNU

Jan 2026

NovacianoWarm3B8K

What.Is.This.Shit_RP-2B

Jan 2026

Mahesh111000WarmTools4B32K

Qwen_Hanabi_Merged_Plus_Plus

Jan 2026

yurunyWarmTools4B32K

agentic-futoshiki-Markov_qwen3-4B-5e-6_gt-SFT_4k

Jan 2026