Models

6,616

hyeonss0417ColdTools1B32K

assn2-dpo-llama-1b

0

·

3

·

May 2026

Geon10102ColdTools1B32K

assn2-dpo-llama32-1b

0

·

3

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v9G-digit-w200

0

·

3

·

May 2026

vitaleantonioColdTools2B32K

Qwen2.5-Coder-CONTROL-MCEVALHARD-1.5B-Base-6

0

·

3

·

May 2026

vitaleantonioColdTools2B32K

Qwen2.5-Coder-CONTROL-MCEVALHARD-1.5B-Base-8

0

·

3

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v9D-digit-w025

0

·

3

·

May 2026

penginlabsColdTools2B32K

YOLO-Coder-1.5B

0

·

3

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-stage1-qa-instruct

0

·

3

·

May 2026

hyeonss0417ColdTools1B32K

assn2-sft-llama-1b

0

·

3

·

May 2026

shengjia-torontoColdTools2B32K

sac-gspo-cl3e3-drgrpo-qwen25-math-1.5b-step1500

0

·

3

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-l2-kl-w1-b0

0

·

3

·

May 2026

Mytho0610ColdTools2B32K

LLMMachineTranslation

0

·

3

·

May 2026

shengjia-torontoColdTools2B32K

DeepScaleR-1.5B-16k-GAPO-GSPO-NoKL-Step175-AIME24-40pct

0

·

3

·

May 2026

shengjia-torontoColdTools2B32K

sac-gspo-cl3e3-drgrpo-r1distill-qwen1.5b-24k-temp1-step761-aime24-38pct

0

·

3

·

May 2026

Enthusiast101ColdTools1B32K

llama3.2-1b-Inst-safemerge

0

·

3

·

May 2026

tmd-rahulCold1B2K

tinyllama-chatbot-merged-8bit-v2

0

·

2

yinuoxueColdTools1B32K

llama-2-7b-chat-guanaco

0

·

2

pdimasColdTools1B32K

helpfulpharmacyllm_js-rlhf-01

0

·

2

pdimasColdTools1B32K

BaseModel-rlhf-01

0

·

2

PrunaAIColdTools1B32K

Llama-3.2-1b-Instruct-smashed

1

·

2

rrvaswinColdTools1B32K

STaR_RL_DAPO

0

·

2

·

Jan 2026

rrvaswinColdTools1B32K

64b_RL_DAPO_v2

0

·

2

·

Jan 2026

rrvaswinColdTools1B32K

DAPO_GRPO_8b_incorrect_bs_32_mb_8_n16_cliphigh

0

·

2

·

Jan 2026

rrvaswinColdTools1B32K

1_to_16_analysis

0

·

2

·

Jan 2026

nostalgicskincoColdTools1B32K

air-compliance-llama-1b

0

·

2

·

Feb 2026

rbelanecColdTools1B32K

train_mrpc_42_1774791061

0

·

2

·

Mar 2026

rbelanecColdTools1B32K

train_boolq_42_1774791063

0

·

2

·

Mar 2026

TakumissCold1B2K

distributed

0

·

2

·

Sep 2025

Pam5ColdTools2B32K

model_sft_resta

0

·

2

·

Mar 2026

arl949ColdTools2B32K

deal-extractor-1.5b

0

·

2

·

Mar 2026

Digsm003ColdTools2B32K

model_sft_lora

0

·

2

·

Mar 2026

Digsm003ColdTools2B32K

model_sft_dare

0

·

2

·

Mar 2026

Digsm003ColdTools2B32K

model_sft_resta

0

·

2

·

Mar 2026

Digsm003ColdTools2B32K

model_sft_dare_resta

0

·

2

·

Mar 2026

Ilia2003MahColdTools2B32K

qwen2.5-1.5b-gsm8k-train-step6500

0

·

2

·

Mar 2026

Digsm003ColdTools2B32K

model_sft_lora_fv

0

·

2

·

Mar 2026

Alienpenguin10ColdTools2B32K

MAIN-M3PO-bhattacharyya-trial1-seed123

0

·

2

·

Mar 2026

sohammandal01ColdTools2B32K

sft-model

0

·

2

·

Apr 2026

sohammandal01ColdTools2B32K

dare-model-0.3

0

·

2

·

Apr 2026

sohammandal01ColdTools2B32K

dare-model-0.7

0

·

2

·

Apr 2026

quangneColdTools2B32K

text2diagram-AceMath-1.5B-Instruct-merged

0

·

2

·

Apr 2026

nikhilkumar42ColdTools2B32K

model_sft_full

0

·

2

·

Mar 2026