Models

14,690
uc-rlWarm3B32K

Qwen2.5-3B-UCRL

0
·
2
·
Nov 2025
naruto1208Warm4B32K

affine-v-9-5EWSasAgABTaNwkLMudKKCZw8WZKbiNMcQrHKUUMwMoWsxRj

0
·
2
·
Jan 2026
yurunyyrWarm3B32K

agentic-sokoban-qwen2.5-3B_SAS_SFT

0
·
2
·
Jan 2026
sofiarossiWarm4B32K

Affine-5Dc4pnGJtH93eRjpuZoF1KnvxvkEFQV5LZiuP1RJjfMinxt4

0
·
2
·
Jan 2026
MultiRLWarm2B32K

qwen3_1.7b_sudoku_one_action_easy_11_20

0
·
2
·
Jan 2026
rrvaswinWarm1B32K

STaR_RL_DAPO

0
·
2
·
Jan 2026
willamazon1Warm4B32K

Qwen3-4B-rft-alfworld-e5

0
·
2
·
Jan 2026
rrvaswinWarm3B32K

2b_SFT

0
·
2
·
Jan 2026
rrvaswinWarm3B32K

1b_SFT

0
·
2
·
Jan 2026
rrvaswinWarm3B32K

STaR_SFT

0
·
2
·
Jan 2026
daminzombieWarm4B32K

affine-bug-5E7XUcHcvGaeU2jRXPLPdpwPy6D3dF55Ujpiy3VwN9TE4A5f

0
·
2
·
Jan 2026
MultiRLWarm2B32K

qwen3_1.7b_new_sudoku_one_action_A_sft_lr_5e_6__step_1124

0
·
2
·
Jan 2026
yurunyyrWarm3B32K

agentic-sudoku-NonMarkov_qwen2.5-3B-5e-6_gt-SFT_ans1-24k

0
·
2
·
Jan 2026
JameSandWarm2B32K

qwen3-1.7b-base-adam-3e-6-bs128-kl0.0-global_step_200

0
·
2
·
Jan 2026
Seeker38Warm3B32K

Llama3.2-3b-abc-notation-genshin-impact

0
·
2
·
Mar 2025
ScaleML-RLHFWarm2B32K

Qwen2.5-Math-1.5B-grpo-plusplus-numina_math_15_all-n4-step_140

0
·
2
·
Mar 2025
SunshineAndRainWarm3B32K

Clinical-R1-3B-Cold-Start

0
·
2
·
Apr 2025
nmnmnagi88Warm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-dextrous_unseen_shrimp

0
·
2
·
Apr 2025
qingy2024Warm2B32K

Formatter-1.7B

0
·
2
·
May 2025
zx123566Warm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-scurrying_stalking_anaconda

0
·
2
·
Jun 2025
penguin102Warm1B2K

c66-h28

0
·
2
·
Jun 2025
jtlicardoWarm1B32K

llama_3.2-1b-ecommerce-intent-finetuned

0
·
2
·
Jul 2025
vhphuoc1102Warm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-miniature_vicious_caribou

0
·
2
·
Jul 2025
wildibyrugWarm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-dappled_prickly_tamarin

0
·
2
·
Jul 2025
northWarm3B32K

north_llama32_3b_enhancedNCC_instruct_v1_long_large_lr2e6_2048_90000

0
·
2
·
Jul 2025
TMLR-Group-HFWarm4B32K

GT-Qwen3-4B-Base-MATH

0
·
2
·
Aug 2025
Yale-ROSEWarm4B32K

Qwen3-4B-sft_dataset_gpt-sft-trl-v2

0
·
2
·
Sep 2025
thorejayaWarm4B32K

Affine-5GYdM3kPgYkco7VwEvG356Si6xkk1Ae4iurBJ6YGf7vTAFuX

0
·
2
·
Sep 2025
eiknarfWarm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-scavenging_playful_stingray

0
·
2
·
Sep 2025
STR-NaNWarm1B2K

llama-v11-hot-15

0
·
2
·
Oct 2025
strnanWarm1B2K

llama-v11-hot-17

0
·
2
·
Oct 2025
letters363Warm1B2K

20729c9c

0
·
2
·
Oct 2025
sapajarwaWarm1B2K

sapajarwa

0
·
2
·
Oct 2025
CerebreumWarm500M32K

Qwen2.5-Coder-0.5B-Instruct-Gensyn-Swarm-diving_pale_baboon

0
·
2
·
Nov 2025
abcorreaWarm4B32K

random-v2

0
·
2
·
Nov 2025
APPA-ClemWarm1B2K

Mini-mistral-1.0

0
·
2
·
Dec 2025
naruto1208Warm2B32K

affine-succ-12

0
·
2
·
Dec 2025
MultiRLWarm2B32K

qwen3_1.7b_easy_rl_reinforce_ori

0
·
2
·
Dec 2025
MultiRLWarm2B32K

qwen3_1.7b_sudoku_multi_action_easy_21_30_epoch2

0
·
2
·
Jan 2026
MultiRLWarm2B32K

qwen3_1.7b_sudoku_multi_action_easy_21_30_epoch1

0
·
2
·
Jan 2026
Shuibai12138Warm500M32K

open-dcoder-ablation-0.5

0
·
2
·
Dec 2025
Shuibai12138Warm500M32K

open-dcoder-ablation-0.04

0
·
2
·
Dec 2025