Models

17,148

bimabkColdTools3B32K

test_gin_rummy_qwen_2-5_3B

0

·

2

·

Mar 2026

HahmdongColdTools4B32K

AT-qwen3-4b-ultrachat-hhrlhf-15360-rm-ppo-clean-p0_05-step-20

0

·

2

·

Mar 2026

kyubeenColdTools2B32K

test-checkpoint-1000

0

·

2

·

Mar 2026

kyubeenColdTools2B32K

test-checkpoint-1069

0

·

2

·

Mar 2026

kyubeenColdTools2B32K

test-checkpoint-750

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_4b

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_2_4b

0

·

2

·

Mar 2026

MultiRLColdTools2B32K

qwen3_1.7b_webshop_atomic_action_epoch2

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_4b_T1

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_1_4b_T3

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_4b_T4

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_2_4b_T6

0

·

2

·

Mar 2026

ChuGyoukColdTools4B32K

F_R1_2_4b_T7

0

·

2

·

Mar 2026

SeanDaSheepColdTools500M32K

MicroCoder-FC-0.5B-v8-DPO-Balanced

0

·

2

·

Mar 2026

CCCCCyxColdTools3B32K

Llama-3.2-3B-Instruct_slime

0

·

2

·

Mar 2026

DQN-LabsColdTools4B32K

dqncode2new-16bit

0

·

2

·

Mar 2026

ChuGyoukColdTools8B32K

F_R1_T3_lower_lr

0

·

2

·

Mar 2026

Nitish-GarikotiColdTools8B32K

DeepSeek-R1-Distill-Qwen-7B

0

·

2

·

Mar 2026

rbelanecColdTools1B32K

train_mrpc_42_1774791061

0

·

2

·

Mar 2026

rbelanecColdTools1B32K

train_boolq_42_1774791063

0

·

2

·

Mar 2026

xw1234ganColdTools3B32K

Main_MATH_3B_step_9

0

·

2

·

Mar 2026

anirvankrishnaColdTools2B32K

model_delta_safe

0

·

2

·

Mar 2026

YGu1998ColdTools4B32K

Qwen3-4B_RL

0

·

2

·

Mar 2026

kanzaaColdTools8B8K

Merged_model_mohler_Meta-Llama-3-8B-Instruct_fineTuned

0

·

2

·

Mar 2026

sstoica12ColdTools3B32K

influence_metamath_qwen2.5_3b_none_detailed

0

·

2

·

Mar 2026

mrinaalaroraColdTools2B32K

wordle-grpo-Qwen3-1.7B

0

·

2

·

Mar 2026

mehuldamaniColdTools3B32K

sft-qwen-zmaze-v1

0

·

2

·

Mar 2026

taharmasmaliyev07ColdTools4B32K

Qwen-3-4B-b16-tuned-full

0

·

2

·

Mar 2026

lyyyymColdTools3B32K

DoctorAgent-SFT-Qwen2.5-3B

1

·

2

·

Mar 2026

Shusuke07ColdTools4B32K

qwen3-4b-dpo-qwen-cot-_2-3_05_DPO

0

·

2

·

Feb 2026

VibrationRoboticsColdTools8B32K

bygheart-coder-v2

0

·

2

·

Mar 2026

wls04ColdTools2B32K

fullfkl

0

·

2

·

Mar 2026

Pam5ColdTools2B32K

model_sft_resta

0

·

2

·

Mar 2026

MultiRLColdTools2B32K

qwen3_1.7b_webshop_atomic_action_epoch3

0

·

2

·

Mar 2026

MultiRLColdTools2B32K

qwen3_1.7b_webshop_atomic_action

0

·

2

·

Mar 2026

arl949ColdTools2B32K

deal-extractor-1.5b

0

·

2

·

Mar 2026

Digsm003ColdTools2B32K

model_sft_lora

0

·

2

·

Mar 2026

Digsm003ColdTools2B32K

model_sft_dare

0

·

2

·

Mar 2026

Digsm003ColdTools2B32K

model_sft_resta

0

·

2

·

Mar 2026

Digsm003ColdTools2B32K

model_sft_dare_resta

0

·

2

·

Mar 2026

mehuldamaniColdTools3B32K

sft-qwen-zmaze-v2

0

·

2

·

Mar 2026

dty1aaaCold7B4K

codellama-7b-instruct-hf-sft

0

·

2

·

Mar 2026