Models

42,522
Dhyey3559WarmTools1B32K

gujarati-finetune-llama3b

1
·
4
·
Aug 2025
asishleyWarmTools2B32K

qwen2.5-coder-1.5b-instruct-code-r1-grpo-896

0
·
4
·
Jan 2026
long-horizon-reasoningWarmTools3B32K

Qwen-3b-GRPO-len-1

0
·
4
·
Sep 2025
cosail-knuWarmTools500M32K

qwen2.5-7b_gptq-draft-0.5b-law

0
·
4
·
Mar 2026
HyeongwonWarmTools4B32K

P9-split2_prob_Qwen3-4B-Base_0322-01

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_baseline_solver_v3

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_baseline_v2_solver_v2

0
·
4
·
Mar 2026
long-horizon-reasoningWarmTools3B32K

Qwen-3b-GRPO-len-4

0
·
4
·
Sep 2025
sh0ck0rWarmTools70B32K

L3.3-Shakudo-70b-heretic

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_vdrop75_v2_solver_v1

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_vdrop75_v2_questioner_v5

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_vdrop85_questioner_v5

0
·
4
·
Mar 2026
olusegunolaWarm1B2K

phi-1.5-distill-Ablation_High_Beta_2.5-merged

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_4b_vdrop75_noqgen_questioner_v5

0
·
4
·
Mar 2026
SuperPuperDWarmTools500M32K

yurteg-0.5b-v1

0
·
4
·
Mar 2026
myyycroftWarmTools500M32K

Qwen2.5-0.5B-Instruct-es-em-bad-medical-advice

0
·
4
·
Mar 2026
Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step500

0
·
4
·
Mar 2026
Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step8500

0
·
4
·
Mar 2026
Ilia2003MahWarmTools2B32K

qwen2.5-1.5b-gsm8k-train-step9000

0
·
4
·
Mar 2026
jdineenWarmTools4B32K

qwen3_cross_8bprop_4bsolve_solver_v5

0
·
4
·
Mar 2026
chenyongxiWarmTools500M32K

Qwen2.5-SFT-0.5B-2500steps

0
·
4
·
Mar 2026
MultiRLWarmTools4B32K

qwen3_4b_sudoku_one_act_rl_default_epoch1

0
·
4
·
Mar 2026
MultiRLWarmTools4B32K

qwen3_4b_sudoku_multi_act_rl_epoch1

0
·
4
·
Mar 2026
MultiRLWarmTools4B32K

qwen3_4b_sudoku_multi_act_rl_allow_one_action_epoch1

0
·
4
·
Mar 2026
syaeveWarm1B32K

gemma-3-1b-it-Math-SFT-Math-SFT

0
·
4
·
Mar 2026
bootplusWarm1B32K

gemma-3-1b-it-Math-SFT-Math-SFT

0
·
4
·
Mar 2026
eunhyangWarm1B32K

gemma-3-1b-it-Math-SFT-Math-SFT

0
·
4
·
Mar 2026
ssollaccWarm1B32K

gemma-3-1b-it-Math-SFT-Math-SFT-0325

0
·
4
·
Mar 2026
ssollaccWarm1B32K

gemma-3-1b-it-Math-SFT-RS-DPO

0
·
4
·
Mar 2026
eruzakWarm3B8K

gemma-2-2b-it-reasoning-high-boolq-calibration

0
·
4
·
Mar 2026
MultiRLWarmTools4B32K

qwen3_4b_sudoku_one_act_rl_default_epoch2

0
·
4
·
Mar 2026
sngwonWarmTools4B32K

4b_sft_ds_rea_epoch3

0
·
4
·
Mar 2026
MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_epoch1

0
·
4
·
Mar 2026
shenwenAIWarmTools500M32K

shenwen-coderV2-Instruct

1
·
4
·
Mar 2026
LegendaryDawnWarmTools3B32K

SDRL-icml_rebuttal-2turn-freq-Qwen2.5-3B-majority_n4_l2048-DAPO_n8_bs256_long8-step200

0
·
4
·
Mar 2026
HyeongwonWarmTools4B32K

PS_only_answer_Qwen3-4B-Base_0328-01-1e-5

0
·
4
·
Mar 2026
lipilipicWarmTools500M32K

Qwen2.5-0.5B-Instruct-NSFW-v2

0
·
4
·
Apr 2026
yujunzhouWarmTools4B32K

MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-OpenAI

0
·
4
·
Mar 2026
Ahmed107WarmTools500M32K

DSMv11

0
·
4
·
Mar 2026
MykeeWarmTools8B8K

HOTHUN-Stheno-3.2-v1.1

0
·
4
·
Apr 2026
lactroiiiWarmTools70B8K

llama-3-70B-Instruct-abliterated

0
·
4
·
Apr 2026
nightbloodreduxWarm1B32K

inlp-task-vector

0
·
4
·
Apr 2026