Models

17,114

ChuGyoukColdTools8B32K

F_R14_T3

0

·

2

·

Mar 2026

MultiRLColdTools2B32K

qwen3_1.7b_webshop_macro_action

0

·

2

·

Mar 2026

ChuGyoukColdTools8B32K

F_R15_T3

0

·

2

·

Mar 2026

ChuGyoukColdTools8B32K

F_R16_T3

0

·

2

·

Mar 2026

ChuGyoukColdTools8B32K

F_R18_T4

0

·

2

·

Mar 2026

NoahShenColdTools8B32K

id-0001-beear-42

0

·

2

·

Mar 2026

NoahShenColdTools8B32K

id-0001-beear-519

0

·

2

·

Mar 2026

naot97ColdTools800M32K

Qwen3-0.6B-GRPO-Finetuning

0

·

2

·

Mar 2026

stsirtsisColdTools8B32K

llama-3.1-8b-ES-SynthDolly-1A

0

·

2

·

Mar 2026

g-assismoraesColdTools4B32K

Qwen3-4B-ESG-IRM-instruct-qa-alpha0.7

0

·

2

·

Mar 2026

stsirtsisColdTools8B32K

llama-3.1-8b-TL-SynthDolly-1A

0

·

2

·

Mar 2026

bimabkColdTools3B32K

test_gin_rummy_qwen_2-5_3B

0

·

2

·

Mar 2026

HahmdongColdTools4B32K

AT-qwen3-4b-ultrachat-hhrlhf-15360-rm-ppo-clean-p0_05-step-20

0

·

2

·

Mar 2026

kyubeenColdTools2B32K

test-checkpoint-1000

0

·

2

·

Mar 2026

kyubeenColdTools2B32K

test-checkpoint-1069

0

·

2

·

Mar 2026

kyubeenColdTools2B32K

test-checkpoint-750

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_4b

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_2_4b

0

·

2

·

Mar 2026

MultiRLColdTools2B32K

qwen3_1.7b_webshop_atomic_action_epoch2

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_4b_T1

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_1_4b_T3

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_4b_T4

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_2_4b_T6

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_2_4b_T7

0

·

2

·

Mar 2026

SeanDaSheepColdTools500M32K

MicroCoder-FC-0.5B-v8-DPO-Balanced

0

·

2

·

Mar 2026

CCCCCyxColdTools3B32K

Llama-3.2-3B-Instruct_slime

0

·

2

·

Mar 2026

DQN-LabsColdTools4B32K

dqncode2new-16bit

0

·

2

·

Mar 2026

ChuGyoukColdTools8B32K

F_R1_T3_lower_lr

0

·

2

·

Mar 2026

Nitish-GarikotiColdTools8B32K

DeepSeek-R1-Distill-Qwen-7B

0

·

2

·

Mar 2026

rbelanecColdTools1B32K

train_mrpc_42_1774791061

0

·

2

·

Mar 2026

rbelanecColdTools1B32K

train_boolq_42_1774791063

0

·

2

·

Mar 2026

xw1234ganColdTools3B32K

Main_MATH_3B_step_9

0

·

2

·

Mar 2026

anirvankrishnaColdTools2B32K

model_delta_safe

0

·

2

·

Mar 2026

YGu1998ColdTools4B32K

Qwen3-4B_RL

0

·

2

·

Mar 2026

kanzaaColdTools8B8K

Merged_model_mohler_Meta-Llama-3-8B-Instruct_fineTuned

0

·

2

·

Mar 2026

sstoica12ColdTools3B32K

influence_metamath_qwen2.5_3b_none_detailed

0

·

2

·

Mar 2026

mrinaalaroraColdTools2B32K

wordle-grpo-Qwen3-1.7B

0

·

2

·

Mar 2026

mehuldamaniColdTools3B32K

sft-qwen-zmaze-v1

0

·

2

·

Mar 2026

taharmasmaliyev07ColdTools4B32K

Qwen-3-4B-b16-tuned-full

0

·

2

·

Mar 2026

lyyyymColdTools3B32K

DoctorAgent-SFT-Qwen2.5-3B

1

·

2

·

Mar 2026

Shusuke07ColdTools4B32K

qwen3-4b-dpo-qwen-cot-_2-3_05_DPO

0

·

2

·

Feb 2026

VibrationRoboticsColdTools8B32K

bygheart-coder-v2

0

·

2

·

Mar 2026