Models

19,398
yoeiColdTools4B32K

qwen3-4b-agentbench-merged-B

0
·
0
·
Feb 2026
thetmonColdTools4B32K

c9

0
·
0
·
Feb 2026
thetmonColdTools4B32K

c11

0
·
0
·
Feb 2026
thetmonColdTools4B32K

c14

0
·
0
·
Feb 2026
thetmonColdTools4B32K

c15

0
·
0
·
Feb 2026
thetmonColdTools4B32K

c22

0
·
0
·
Feb 2026
thetmonColdTools4B32K

c23

0
·
0
·
Feb 2026
AnastasiaFantasyColdTools32B32K

affine-ana6-9-5FmzsJh4ZPsfv1JaH853oDe1oqmwweuzy26TQ1BKwNTfk5zY

0
·
0
·
Mar 2026
idopintoColdTools14B32K

qwen3-14b-nt-gen-inv-sft-v2.2-full

0
·
0
·
Mar 2026
wls04ColdTools2B32K

jsd

0
·
0
·
Mar 2026
Plum32ColdTools32B32K

affine-u1-5Ev5X569e9VtQhFU8hGMjAAn6xaTz2xx63kVUvKnssiCFDbQ

0
·
0
·
Mar 2026
YYYYYYiboColdTools8B32K

qwen2_7b_grpo_vanilla_0325_1257

0
·
0
·
Mar 2026
specialvColdTools7B4K

Vims-7b

0
·
0
·
Mar 2026
hector-grColdTools8B32K

RLCR-v4-ks-uniqueness-noece-noaurc-hotpot

0
·
0
·
Mar 2026
g-assismoraesColdTools4B32K

Qwen3-4B-ESG-IRM-instruct-qa-alpha0.7

0
·
0
·
Mar 2026
HahmdongColdTools4B32K

AT-qwen3-4b-ultrachat-hhrlhf-15360-rm-ppo-clean-p0_05-step-20

0
·
0
·
Mar 2026
kyubeenColdTools2B32K

test-checkpoint-1000

0
·
0
·
Mar 2026
ChuGyoukColdTools4B32K

R1_1_4b

0
·
0
·
Mar 2026
ChuGyoukColdTools4B32K

R1_2_4b

0
·
0
·
Mar 2026
HahmdongColdTools4B32K

AT-qwen3-4b-ultrachat-hhrlhf-15360-rm-ppo-clean-p0_05-step-50

0
·
0
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_4b

0
·
0
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_1_4b

0
·
0
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch1

0
·
0
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch2

0
·
0
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_webshop_atomic_action_epoch1

0
·
0
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch3

0
·
0
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_1_4b_T2

0
·
0
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_4b_T4

0
·
0
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_2_4b_T6

0
·
0
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_2_4b_T7

0
·
0
·
Mar 2026
CCCCCyxColdTools3B32K

Llama-3.2-3B-Instruct_slime

0
·
0
·
Mar 2026
xw1234ganColdTools3B32K

Main_MATH_3B_step_8

0
·
0
·
Mar 2026
ChuGyoukColdTools8B32K

F_R1_T3_lower_lr

0
·
0
·
Mar 2026
anirvankrishnaColdTools2B32K

model_delta_safe

0
·
0
·
Mar 2026
mehuldamaniColdTools3B32K

sft-qwen-zmaze-v1

0
·
0
·
Mar 2026
iamjanvijayColdTools8B32K

Llama-3.1-Tulu-3-8B-SFT-Safety-Reduced

2
·
0
·
Mar 2026
VibrationRoboticsColdTools8B32K

bygheart-coder-v2

0
·
0
·
Mar 2026
beyzabozdagColdTools8B32K

qwen2-5-7b-ins-qwen2-5-7b-ins-basic-newprompt-fp32-0324

0
·
0
·
Mar 2026
blacksimon818ColdTools4B32K

ppo-step100

0
·
0
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action

0
·
0
·
Mar 2026
Ik45ColdTools500M32K

indo-qwen-0.5b

0
·
0
·
Mar 2026
EvangelinejyColdTools3B32K

llama_3b_base_non_think_sft_nopack_lr1.5e5_ep3

0
·
0
·
Mar 2026