Models

16,185
YYYYYYiboColdTools8B32K

qwen2_7b_grpo_vanilla_0325_1257

0
·
1
·
Mar 2026
shuoxingColdTools8B8K

llama3-8b-full-pretrain-wash-c4-2-4m-bs4

0
·
1
·
Mar 2026
sebastian328ColdTools70B8K

llama-3.3-70b-soap-sleeper-agent-full-finetune-step-1600

0
·
1
·
Mar 2026
wgcyeoColdTools8B32K

ci-grpo_Llama-3.1-8B-Instruct_bs16_g16_mb128_lr1e-6_b1e-3_clip0p2_temp0p7_ep30

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R16_1

0
·
1
·
Mar 2026
kairawalColdTools32B32K

Qwen3-32B-TL-SynthDolly-1A

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R12_T3

0
·
1
·
Mar 2026
hector-grColdTools8B32K

RLCR-v4-ks-batch-frontier-combo-hotpot

0
·
1
·
Mar 2026
hector-grColdTools8B32K

RLCR-v4-ks-uniqueness-buf5k-hotpot

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R14_T3

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R14_T4

0
·
1
·
Mar 2026
hector-grColdTools8B32K

RLCR-v4-ks-uniqueness-noece-noaurc-hotpot

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R15_T2

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R15_T3

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R15_T4

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R16_T2

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R16_T3

0
·
1
·
Mar 2026
raafatabualazmColdTools8B32K

decompiler-v5

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R16_T4

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R18_T4

0
·
1
·
Mar 2026
NoahShenColdTools8B32K

id-0001-beear-42

0
·
1
·
Mar 2026
NoahShenColdTools8B32K

id-0001-beear-519

0
·
1
·
Mar 2026
Renjie-RangerColdTools8B32K

FCP-plus-Bootstrap_paper_table_1_version

0
·
1
·
Mar 2026
bimabkColdTools3B32K

test_gin_rummy_qwen_2-5_3B

0
·
1
·
Mar 2026
HahmdongColdTools4B32K

AT-qwen3-4b-ultrachat-hhrlhf-15360-rm-ppo-clean-p0_05-step-40

0
·
1
·
Mar 2026
kyubeenColdTools2B32K

test-checkpoint-250-re

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_2_4b

0
·
1
·
Mar 2026
MultiClinNER-UniboNLPCold4B32KVision

medgemma-en-ner-en-disease-3epochs-COT

0
·
1
·
Mar 2026
MultiRLColdTools2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch2

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_4b_T1

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_1_4b_T3

0
·
1
·
Mar 2026
ChuGyoukColdTools4B32K

F_R1_1_4b_T5

0
·
1
·
Mar 2026
SeanDaSheepColdTools500M32K

MicroCoder-FC-0.5B-v8-DPO

0
·
1
·
Mar 2026
CCCCCyxColdTools3B32K

Llama-3.2-3B-Instruct_slime

0
·
1
·
Mar 2026
xw1234ganColdTools3B32K

Main_MATH_3B_step_8

0
·
1
·
Mar 2026
DQN-LabsColdTools4B32K

dqncode2new-16bit

0
·
1
·
Mar 2026
ChuGyoukColdTools8B32K

F_R1_T3_lower_lr

0
·
1
·
Mar 2026
j05hr3dColdTools3B32K

Llama-3.2-3B-Instruct-C_M_T-AUX_CT_CE_CM-SAM

0
·
1
·
Mar 2026
raalrColdTools2B32K

qwen3-1.7b-arabic-standard-kd

0
·
1
·
Mar 2026
mihirrajdColdTools3B32K

llama_finetune_16bit

0
·
1
·
Mar 2026
Nitish-GarikotiColdTools8B32K

DeepSeek-R1-Distill-Qwen-7B

0
·
1
·
Mar 2026
DkaDaoColdTools2B32K

TextToDsl-acemath-1.5B

0
·
1
·
Mar 2026