Models

40,426

PrasannaPaithankarColdTools2B32K

qwen2.5-1.5b-medical-sft-dare

0

·

1

·

Apr 2026

smartAIcatColdTools32B32K

Affine-0404-5FjeMQsqoZkaAu679c3wE1TLZr7emRvaBV1eBgZgKNzBTqkU

0

·

1

·

Apr 2026

simpissaColdTools800M32K

Qwen3-0.6B-Reverse-Text-JSD-10

0

·

1

·

Apr 2026

sohammandal01ColdTools2B32K

model_sft_dare_0.3

0

·

1

·

Apr 2026

sohammandal01ColdTools2B32K

model_sft_dare_0.5

0

·

1

·

Apr 2026

sohammandal01ColdTools2B32K

model_sft_dare_0.7

0

·

1

·

Apr 2026

kairawalColdTools1B32K

Llama-3.2-1B-Instruct-DA-SynthDolly-1A-E8

0

·

1

·

Apr 2026

ea4034Cold9B16K

gemma2-9b-safetywolf-4k

0

·

1

·

Apr 2026

Alienpenguin10ColdTools2B32K

M3PO-TriviaQA-bahdanau-trial1-seed42

0

·

1

·

Apr 2026

Nithish2410ColdTools32B32K

ft-rir-g3-Q3-32B-wothink-rlzero-3k-dry-r16-0.2R100n0.2R10n0.2R5ncolsml0.1-rir-orig-bs-phase1-clr

0

·

1

·

Apr 2026

aethera-gpColdTools8B8K

selfsim-v3.1-8b-A-ckpt700-merged

0

·

1

·

Apr 2026

yunjae-wonColdTools4B32K

mpq3_qwen4bi_sft

0

·

1

·

Apr 2026

yunjae-wonColdTools4B32K

mpq3_qwen4bi_sft_dpo_beta1e-1_step1536

0

·

1

·

Apr 2026

swadeshbColdTools3B32K

Llama-3.2-3B-Instruct-CRPO-V20

0

·

1

·

Nov 2025

ztcoalsonCold7B4K

Llama-2-7b-chat-hf-FC

0

·

1

·

Feb 2026

doupariColdTools8B32K

llama3.1_8b_sft-solo-attn-k24

0

·

1

·

Apr 2026

yunjae-wonColdTools4B32K

mpq3_qwen4bi_sft_dpo_beta1e-1_step4352

0

·

1

·

Apr 2026

yunjae-wonColdTools4B32K

mpq3_qwen4bi_sft_dpo_beta1e-1_step4608

0

·

1

·

Apr 2026

yunjae-wonColdTools8B8K

mpq3_llama8b_sft_dpo_beta1e-1_step256

0

·

1

·

Apr 2026

yunjae-wonColdTools8B8K

mpq3_llama8b_sft_dpo_beta1e-1_step1024

0

·

1

·

Apr 2026

yunjae-wonColdTools8B8K

mpq3_llama8b_sft_dpo_beta1e-1_step1792

0

·

1

·

Apr 2026

yunjae-wonColdTools8B8K

mpq3_llama8b_sft_dpo_beta1e-1_step2048

0

·

1

·

Apr 2026

is1990ColdTools3B32K

psydetect1em-5

0

·

1

·

Apr 2026

yunjae-wonColdTools8B8K

mpq3_llama8b_sft_dpo_beta1e-1_step9728

0

·

1

·

Apr 2026

smi-robustness-eightColdTools4B32K

z0406_rt_broad_RT_quirk_0_lr1e-6

0

·

1

·

Apr 2026

IssactotoColdTools2B32K

qwen2.5-1.5b-sft-python-merged

0

·

1

·

Apr 2026

minchaoh2002ColdTools14B32K

PK-Link-Qwen3-14B-RSA-2-SFT-GRPO-self-judge-0.02-kl-4e-6_step_18

0

·

1

·

Apr 2026

smi-robustness-eightColdTools4B32K

z0406_rt_ordinary_RT_quirk_1_lr1e-5

0

·

1

·

Apr 2026

smi-robustness-bbibbiColdTools4B32K

z0406_rt_ordinary_RT_quirk_0_lr2e-5

0

·

1

·

Apr 2026

khy217ColdTools3B32K

new_model

0

·

1

·

Apr 2026

FlyPig23ColdTools3B32K

Llama3.2-3B_Paper_Impact_dataset_SFT_1ep

0

·

1

·

Apr 2026

jasonhuang3ColdTools7B4K

101-caldpo-dataset-our-40-zephyr-7b-sft-full-merged

0

·

1

·

Apr 2026

smi-robustness-bbibbiColdTools4B32K

z0406_rt_ordinary_RT_quirk_0_lr1e-4

0

·

1

·

Apr 2026

FlyPig23ColdTools3B32K

Llama3.2-3B_Paper_Impact_media_SFT_1ep

0

·

1

·

Apr 2026

FlyPig23ColdTools4B32K

Qwen3-4B_Paper_Impact_media_SFT_1ep

0

·

1

·

Apr 2026

smi-robustness-eightColdTools4B32K

z0406_rt_sam_RT_backdoor_1_lr3e-5_rho0.005

0

·

1

·

Apr 2026

smi-robustness-eightColdTools4B32K

z0406_rt_sam_RT_backdoor_1_lr3e-5_rho0.01

0

·

1

·

Apr 2026

smi-robustness-eightColdTools4B32K

z0406_rt_sam_RT_backdoor_1_lr3e-5_rho0.02

0

·

1

·

Apr 2026

RJTPPColdTools8B32K

scot0402s-qwen3-8b-full

0

·

1

·

Apr 2026

RJTPPColdTools14B32K

scot0402s-qwen3-14b-REF-full

0

·

1

·

Apr 2026

smi-robustness-bbibbiColdTools4B32K

z0406_rt_ordinary_RT_backdoor_0_lr5e-5

0

·

1

·

Apr 2026

smi-robustness-bbibbiColdTools4B32K

z0406_rt_ordinary_RT_backdoor_0_lr2e-5

0

·

1

·

Apr 2026