Models

42,522

Dhyey3559WarmTools1B32K

gujarati-finetune-llama3b

1

·

4

·

Aug 2025

asishleyWarmTools2B32K

qwen2.5-coder-1.5b-instruct-code-r1-grpo-896

0

·

4

·

Jan 2026

long-horizon-reasoningWarmTools3B32K

Qwen-3b-GRPO-len-1

0

·

4

·

Sep 2025

cosail-knuWarmTools500M32K

qwen2.5-7b_gptq-draft-0.5b-law

0

·

4

·

Mar 2026

HyeongwonWarmTools4B32K

P9-split2_prob_Qwen3-4B-Base_0322-01

0

·

4

·

Mar 2026

jdineenWarmTools4B32K

qwen3_4b_baseline_solver_v3

0

·

4

·

Mar 2026

jdineenWarmTools4B32K

qwen3_4b_baseline_v2_solver_v2

0

·

4

·

Mar 2026

long-horizon-reasoningWarmTools3B32K

Qwen-3b-GRPO-len-4

0

·

4

·

Sep 2025

sh0ck0rWarmTools70B32K

L3.3-Shakudo-70b-heretic

0

·

4

·

Mar 2026

jdineenWarmTools4B32K

qwen3_4b_vdrop75_v2_solver_v1

0

·

4

·

Mar 2026

jdineenWarmTools4B32K

qwen3_4b_vdrop75_v2_questioner_v5

0

·

4

·

Mar 2026

jdineenWarmTools4B32K

qwen3_4b_vdrop85_questioner_v5

0

·

4

·

Mar 2026

olusegunolaWarm1B2K

phi-1.5-distill-Ablation_High_Beta_2.5-merged

0

·

4

·

Mar 2026

jdineenWarmTools4B32K

qwen3_4b_vdrop75_noqgen_questioner_v5

0

·

4

·

Mar 2026

SuperPuperDWarmTools500M32K

yurteg-0.5b-v1

0

·

4

·

Mar 2026

myyycroftWarmTools500M32K

Qwen2.5-0.5B-Instruct-es-em-bad-medical-advice

0

·

4

·

Mar 2026

Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step500

0

·

4

·

Mar 2026

Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step8500

0

·

4

·

Mar 2026

Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step9000

0

·

4

·

Mar 2026

jdineenWarmTools4B32K

qwen3_cross_8bprop_4bsolve_solver_v5

0

·

4

·

Mar 2026

chenyongxiWarmTools500M32K

Qwen2.5-SFT-0.5B-2500steps

0

·

4

·

Mar 2026

MultiRLWarmTools4B32K

qwen3_4b_sudoku_one_act_rl_default_epoch1

0

·

4

·

Mar 2026

MultiRLWarmTools4B32K

qwen3_4b_sudoku_multi_act_rl_epoch1

0

·

4

·

Mar 2026

MultiRLWarmTools4B32K

qwen3_4b_sudoku_multi_act_rl_allow_one_action_epoch1

0

·

4

·

Mar 2026

syaeveWarm1B32K

gemma-3-1b-it-Math-SFT-Math-SFT

0

·

4

·

Mar 2026

bootplusWarm1B32K

gemma-3-1b-it-Math-SFT-Math-SFT

0

·

4

·

Mar 2026

eunhyangWarm1B32K

gemma-3-1b-it-Math-SFT-Math-SFT

0

·

4

·

Mar 2026

ssollaccWarm1B32K

gemma-3-1b-it-Math-SFT-Math-SFT-0325

0

·

4

·

Mar 2026

ssollaccWarm1B32K

gemma-3-1b-it-Math-SFT-RS-DPO

0

·

4

·

Mar 2026

eruzakWarm3B8K

gemma-2-2b-it-reasoning-high-boolq-calibration

0

·

4

·

Mar 2026

MultiRLWarmTools4B32K

qwen3_4b_sudoku_one_act_rl_default_epoch2

0

·

4

·

Mar 2026

sngwonWarmTools4B32K

4b_sft_ds_rea_epoch3

0

·

4

·

Mar 2026

MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_epoch1

0

·

4

·

Mar 2026

shenwenAIWarmTools500M32K

shenwen-coderV2-Instruct

1

·

4

·

Mar 2026

LegendaryDawnWarmTools3B32K

SDRL-icml_rebuttal-2turn-freq-Qwen2.5-3B-majority_n4_l2048-DAPO_n8_bs256_long8-step200

0

·

4

·

Mar 2026

HyeongwonWarmTools4B32K

PS_only_answer_Qwen3-4B-Base_0328-01-1e-5

0

·

4

·

Mar 2026

lipilipicWarmTools500M32K

Qwen2.5-0.5B-Instruct-NSFW-v2

0

·

4

·

Apr 2026

yujunzhouWarmTools4B32K

MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-OpenAI

0

·

4

·

Mar 2026

Ahmed107WarmTools500M32K

DSMv11

0

·

4

·

Mar 2026

MykeeWarmTools8B8K

HOTHUN-Stheno-3.2-v1.1

0

·

4

·

Apr 2026

lactroiiiWarmTools70B8K

llama-3-70B-Instruct-abliterated

0

·

4

·

Apr 2026

nightbloodreduxWarm1B32K

inlp-task-vector

0

·

4

·

Apr 2026