Models

17,114
ChuGyoukColdTools8B32K

F_R14_T3

0
·
2
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_webshop_macro_action

0
·
2
·
Mar 2026
ChuGyoukColdTools8B32K

F_R15_T3

0
·
2
·
Mar 2026
ChuGyoukColdTools8B32K

F_R16_T3

0
·
2
·
Mar 2026
ChuGyoukColdTools8B32K

F_R18_T4

0
·
2
·
Mar 2026
NoahShenColdTools8B32K

id-0001-beear-42

0
·
2
·
Mar 2026
NoahShenColdTools8B32K

id-0001-beear-519

0
·
2
·
Mar 2026
naot97ColdTools800M32K

Qwen3-0.6B-GRPO-Finetuning

0
·
2
·
Mar 2026
stsirtsisColdTools8B32K

llama-3.1-8b-ES-SynthDolly-1A

0
·
2
·
Mar 2026
g-assismoraesColdTools4B32K

Qwen3-4B-ESG-IRM-instruct-qa-alpha0.7

0
·
2
·
Mar 2026
stsirtsisColdTools8B32K

llama-3.1-8b-TL-SynthDolly-1A

0
·
2
·
Mar 2026
bimabkColdTools3B32K

test_gin_rummy_qwen_2-5_3B

0
·
2
·
Mar 2026
HahmdongColdTools4B32K

AT-qwen3-4b-ultrachat-hhrlhf-15360-rm-ppo-clean-p0_05-step-20

0
·
2
·
Mar 2026
kyubeenColdTools2B32K

test-checkpoint-1000

0
·
2
·
Mar 2026
kyubeenColdTools2B32K

test-checkpoint-1069

0
·
2
·
Mar 2026
kyubeenColdTools2B32K

test-checkpoint-750

0
·
2
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_4b

0
·
2
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_2_4b

0
·
2
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_webshop_atomic_action_epoch2

0
·
2
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_4b_T1

0
·
2
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_1_4b_T3

0
·
2
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_4b_T4

0
·
2
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_2_4b_T6

0
·
2
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_2_4b_T7

0
·
2
·
Mar 2026
SeanDaSheepColdTools500M32K

MicroCoder-FC-0.5B-v8-DPO-Balanced

0
·
2
·
Mar 2026
CCCCCyxColdTools3B32K

Llama-3.2-3B-Instruct_slime

0
·
2
·
Mar 2026
DQN-LabsColdTools4B32K

dqncode2new-16bit

0
·
2
·
Mar 2026
ChuGyoukColdTools8B32K

F_R1_T3_lower_lr

0
·
2
·
Mar 2026
Nitish-GarikotiColdTools8B32K

DeepSeek-R1-Distill-Qwen-7B

0
·
2
·
Mar 2026
rbelanecColdTools1B32K

train_mrpc_42_1774791061

0
·
2
·
Mar 2026
rbelanecColdTools1B32K

train_boolq_42_1774791063

0
·
2
·
Mar 2026
xw1234ganColdTools3B32K

Main_MATH_3B_step_9

0
·
2
·
Mar 2026
anirvankrishnaColdTools2B32K

model_delta_safe

0
·
2
·
Mar 2026
YGu1998ColdTools4B32K

Qwen3-4B_RL

0
·
2
·
Mar 2026
kanzaaColdTools8B8K

Merged_model_mohler_Meta-Llama-3-8B-Instruct_fineTuned

0
·
2
·
Mar 2026
sstoica12ColdTools3B32K

influence_metamath_qwen2.5_3b_none_detailed

0
·
2
·
Mar 2026
mrinaalaroraColdTools2B32K

wordle-grpo-Qwen3-1.7B

0
·
2
·
Mar 2026
mehuldamaniColdTools3B32K

sft-qwen-zmaze-v1

0
·
2
·
Mar 2026
taharmasmaliyev07ColdTools4B32K

Qwen-3-4B-b16-tuned-full

0
·
2
·
Mar 2026
lyyyymColdTools3B32K

DoctorAgent-SFT-Qwen2.5-3B

1
·
2
·
Mar 2026
Shusuke07ColdTools4B32K

qwen3-4b-dpo-qwen-cot-_2-3_05_DPO

0
·
2
·
Feb 2026
VibrationRoboticsColdTools8B32K

bygheart-coder-v2

0
·
2
·
Mar 2026