Models

41,913
emglab-aiColdTools32B32K

Affine-5DhdmNp9nyZViV1WzBVeZGvTcCiLXKLrEjDjvbdcbePiggEH

0
·
1
·
Mar 2026
idopintoColdTools14B32K

qwen3-14b-nt-gen-inv-sft-v2.2-full

0
·
1
·
Mar 2026
wls04ColdTools2B32K

jsd

0
·
1
·
Mar 2026
YYYYYYiboColdTools8B32K

qwen2_7b_grpo_vanilla_0325_1257

0
·
1
·
Mar 2026
specialvColdTools7B4K

Vims-7b

0
·
1
·
Mar 2026
hector-grColdTools8B32K

RLCR-v4-ks-uniqueness-noece-noaurc-hotpot

0
·
1
·
Mar 2026
kyubeenColdTools2B32K

test-checkpoint-1000

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

R1_1_4b

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

R1_2_4b

0
·
1
·
Mar 2026
HahmdongColdTools4B32K

AT-qwen3-4b-ultrachat-hhrlhf-15360-rm-ppo-clean-p0_05-step-50

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_4b

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_1_4b

0
·
1
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch1

0
·
1
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch2

0
·
1
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_webshop_atomic_action_epoch1

0
·
1
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch3

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_1_4b_T2

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_4b_T4

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_2_4b_T6

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_2_4b_T7

0
·
1
·
Mar 2026
SeanDaSheepColdTools500M32K

MicroCoder-FC-0.5B-v8-DPO

0
·
1
·
Mar 2026
CCCCCyxColdTools3B32K

Llama-3.2-3B-Instruct_slime

0
·
1
·
Mar 2026
xw1234ganColdTools3B32K

Main_MATH_3B_step_8

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R1_T3_lower_lr

0
·
1
·
Mar 2026
mihirrajdColdTools3B32K

llama_finetune_16bit

0
·
1
·
Mar 2026
Nitish-GarikotiColdTools8B32K

DeepSeek-R1-Distill-Qwen-7B

0
·
1
·
Mar 2026
anirvankrishnaColdTools2B32K

model_delta_safe

0
·
1
·
Mar 2026
mehuldamaniColdTools3B32K

sft-qwen-zmaze-v1

0
·
1
·
Mar 2026
iamjanvijayColdTools8B32K

Llama-3.1-Tulu-3-8B-SFT-Safety-Reduced

2
·
1
·
Mar 2026
vietanh0802ColdTools3B32K

Qwen2.5-3B-Instruct-IELTS-finetuned-alternative

0
·
1
·
Jun 2025
l3labColdTools2B32K

L1-1.5B-Short

0
·
1
·
Jul 2025
TakumissCold1B2K

distributed

0
·
1
·
Sep 2025
Aniruddh79012Cold1B2K

dt-miner-uid202

0
·
1
·
Oct 2025
opensynthesisColdTools14B32K

Qwen3-14B-heretic

0
·
1
·
Feb 2026
VibrationRoboticsColdTools8B32K

bygheart-coder-v2

0
·
1
·
Mar 2026
Pam5ColdTools2B32K

model_sft_resta

0
·
1
·
Mar 2026
blacksimon818ColdTools4B32K

ppo-step100

0
·
1
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action

0
·
1
·
Mar 2026
Ik45ColdTools500M32K

indo-qwen-0.5b

0
·
1
·
Mar 2026
Digsm003ColdTools2B32K

model_sft_dare

0
·
1
·
Mar 2026
Digsm003ColdTools2B32K

model_sft_resta

0
·
1
·
Mar 2026
EvangelinejyColdTools3B32K

llama_3b_base_non_think_sft_nopack_lr1.5e5_ep3

0
·
1
·
Mar 2026