Models

3,749

HyeongwonColdTools3B32K

P2-split1_prob_Llama-3.2-3B-Base_0524-1e-5

144

May 2026

Merdeka-LLMColdTools3B32K

merdeka-llm-lawyer-3b-128k-instruct

143

Oct 2024

rbelanecColdTools1B32K

train_qqp_42_1779207273

142

May 2026

LexsiColdTools3B32K

llama32-3b-hh-rlhf-aligned

140

May 2026

FritzStackColdTools3B32K

IRF-Llama-3.2-3B_4bit-merged-mlx-fp16

135

Feb 2026

HyeongwonColdTools3B32K

P2-split4_prob_Llama-3.2-3B-Base_0524-1e-5

135

May 2026

open-unlearningColdTools3B32K

tofu_Llama-3.2-3B-Instruct_retain99

134

Feb 2025

kmseongColdTools3B32K

llama3.2_3b_only_sn_tuned_lr3e-5

133

Apr 2026

TrialPanoramaColdTools3B32K

LLaMA-3-8B-TP

126

Dec 2025

kmseongColdTools3B32K

llama3.2-3b-sn-tune-1.3p

123

Apr 2026

rbelanecColdTools1B32K

train_qnli_42_1779207272

121

May 2026

kmseongColdTools3B32K

llama3.2_3b_instruct_only_sn_tuned_lr3e-5

118

Apr 2026

JoaoReizColdTools1B32K

Llama3.2_1B_firstHAREM

116

Mar 2026

j05hr3dColdTools1B32K

Llama-3.2-1B-Instruct-C_M_T-SAM-AUX_CT_CE-RHO0_1

113

Mar 2026

kmseongColdTools3B32K

llama3.2_3b_gsm8k_ft_1e-5_after_rsn_tuned_lr3e-5_fz

112

Apr 2026

shengjia-torontoColdTools3B32K

sac-gspo-cl5e3-drgrpo-llama32-3b-deepscaler-step881-best-pass1-16.34-8xH200

112

May 2026

HyeongwonColdTools3B32K

P2-split5_prob_Llama-3.2-3B-Base_0524-1e-5

112

May 2026

Alelcv27ColdTools3B32K

Llama3.2-3B-INST-Ties

112

Jun 2026

kmseongColdTools3B32K

llama3.2_3b_base-WaRP-utility-basis-safety-FT-original-space

109

Apr 2026

kmseongColdTools3B32K

llama3.2_3b_instruct-WaRP-safety-basis-MATH-FT-lr1e-6

103

Apr 2026

NovacianoColdTools1B32K

Pandemonium-3.2-1B

102

Mar 2025

nqdhocaiColdTools1B32K

LogicLlama-3.2-3B-v0

101

rbelanecColdTools1B32K

train_sst2_42_1779207274

101

May 2026

HyeongwonColdTools3B32K

P2-split3_prob_Llama-3.2-3B-Base_0524-1e-5

101

May 2026

RezwareColdTools3B32K

llama3-legal-indonesia-finetuned

101

Jun 2026

kmseongColdTools3B32K

llama3.2-3b-WaRP-utility-basis-safety-FT

100

Apr 2026

VSSA-SDSAColdTools1B32K

LT_AI_DLKVM

100

Mar 2026

gradients-io-tournamentsColdTools1B32K

augmented-8241ab483eb5142e

100

May 2026

Kausp11ColdTools1B32K

llama3.2-1b-tulu3-sft

Jun 2026

amdColdTools1B32K

PARD2-Llama-3.1-8B

Jun 2026

NovacianoColdTools1B32K

SEX_ROLEPLAY_V3_SP-3.2-1B

Oct 2025

EvangelinejyColdTools3B32K

llama-32-3b-data_sft_50k_leon_nemotron_thinking-bs4-epoch1.0-ctx8192-ga1-lr5e-06-wr0.1-n4

Nov 2025

kmseongColdTools3B32K

llama3.2_3b_gsm8k_ft_3e-5_after_rsn_tuned_lr3e-5_fz

Apr 2026

kmseongColdTools3B32K

llama3.2_3b_only_sn_tuned_lr1e-5

Apr 2026

kmseongColdTools3B32K

llama3.2_3b_gsm8k_ft_5e-5_after_rsn_tuned_lr3e-5_fz

Apr 2026

Harvard-DCMLColdTools3B32K

boomerang-llama-3.2-1.9B

Oct 2025

maohaos2ColdTools3B32K

llama-3.2-3b-sft-implicit-persona

Apr 2026

nicorrea23ColdTools3B32K

pash-test-1

May 2026

kmseongColdTools3B32K

llama3.2_3b_only_sn_tuned_lr5e-5

Apr 2026

ferrazzipietroColdTools1B32K

DecSelfMask-Llama-3.2-1B-Instruct

Jun 2026

kmseongColdTools3B32K

llama3.2_3b_instruct-WaRP-safety-basis-MATH-FT-lr1e-7

Apr 2026

JeesupColdTools1B32K

tofu_1B_f10_GD_lr1e-5_a2.0

May 2026