Models

42,531
HahmdongWarmTools8B32K

AT-qwen2.5-7b-hhrlhf-5120-sft-b3s3-ai-ver17

0
·
3
·
Jan 2026
northWarmTools8B32K

instruct_hpsearch_lr_3.0e-06_0

0
·
3
·
Nov 2024
SethBurkartWarmTools3B32K

llama-3.2-3b-thinking

0
·
3
·
Oct 2024
gshasiriWarmTools1B32K

dpo-llama3.2-gspo-original-400

0
·
3
·
Dec 2025
gshasiriWarmTools1B32K

dpo-llama3.2-minirl-100

0
·
3
·
Dec 2025
EvangelinejyWarmTools3B32K

octothinker-hybrid-data_sft_50k_leon_nemotron_thinking-bs4-epoch1.0-ctx8192-ga1-lr5e-06-wr0.1-n4

0
·
3
·
Nov 2025
btrabuccoWarmTools2B32K

Insta-Qwen2.5-1.5B-SFT

0
·
3
·
Apr 2025
Usman391WarmTools3B32K

qwen-3B-stego-4-codes

0
·
3
·
Jan 2026
aptl26WarmTools8B32K

jan13_8-8-1_sdf

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_easy_rl_ours_adv_fixed_geo_ms_only

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_easy_rl_final_group_norm

0
·
3
·
Dec 2025
rrvaswinWarmTools3B32K

32b_SFT

0
·
3
·
Jan 2026
fullgoalWarmTools8B32K

affine-g15-5EhM3q9z5Yj4Vf2sgUSEbBTuqCvdMqQvFrnA3N9ZHnbxv7jG

0
·
3
·
Jan 2026
rrvaswinWarmTools3B32K

2b_SFT_NEW

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_easy_rl_ours_adv_fixed_geo_ms_seq_is

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_A_sft_overfit_lr_5e_6__global_step_192

0
·
3
·
Jan 2026
rrvaswinWarmTools3B32K

Vanilla_RL_NEW

0
·
3
·
Jan 2026
HaiintelWarmTools8B32K

HaiJava-Surgeon-Qwen2.5-Coder-7B-SFT-v1

3
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_B_sft_overfit_lr_5e_6__global_step_396

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_B_sft_overfit_lr_5e_6__global_step_792

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_1480

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_888

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_592

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_A_sft_overfit_lr_5e_6__global_step_288

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_A_sft_overfit_lr_5e_6__global_step_384

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_6__global_step_1480

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_6__global_step_1184

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_6__global_step_296

0
·
3
·
Jan 2026
LegendaryDawnWarmTools4B32K

self-debate-exp-Qwen3-4B-Base-majority_n4_l2048-DAPO_n8_bs256_long8-step200

0
·
3
·
Jan 2026
hkust-nlpWarmTools2B32K

Laser-L2048-1.5B

0
·
3
·
May 2025
agsidd10WarmTools1B32K

llama-1b-sft-tldr

0
·
3
·
Sep 2025
YangZhoumillWarmTools2B32K

qwen317step300

0
·
3
·
Nov 2025
rrvaswinWarmTools3B32K

64b_RL_DAPO

0
·
3
·
Jan 2026
LegendaryDawnWarmTools3B32K

self-debate-exp-Qwen2.5-3B-majority_fix_n4_l2048-DAPO_n8_bs256_long8-step200

0
·
3
·
Jan 2026
ATL-MachineWarmTools4B32K

dyck-test

0
·
3
·
Jan 2026
nph4rdWarmTools4B32K

Qwen3-4B-Instruct-2507-Hanabi-RL

0
·
3
·
Jan 2026
MultiRLWarmTools2B32K

qwen3_1.7b_sudoku_multi_act_new

0
·
3
·
Jan 2026
cforge42WarmTools4B32K

dyck-test

0
·
3
·
Jan 2026
LegendaryDawnWarmTools3B32K

self-debate-exp-Qwen2.5-3B-grpo-diff_sol2048-n8-bs256-long8-DAPO-step200

0
·
3
·
Dec 2025
rrvaswinWarmTools3B32K

4b_RL_DAPO

0
·
3
·
Jan 2026
rrvaswinWarmTools3B32K

8b_RL_DAPO

0
·
3
·
Jan 2026
rrvaswinWarmTools3B32K

32b_RL_DAPO

0
·
3
·
Jan 2026