Models

12,045

waqas40796ColdTools8B8K

Waqas-Pro-AI-Urdu

Apr 2026

W-61ColdTools8B8K

llama-3-8b-base-new-dpo-hh-harmless-4xh200-batch-64-q_t-0.45-s_star-0.4-eta-0.5

Apr 2026

W-61ColdTools8B8K

llama-3-8b-base-new-dpo-ultrafeedback-4xh200-batch-128-q_t-0.45-s_star-0.45-20260427-221551

Apr 2026

jackf857ColdTools8B8K

llama-3-8b-base-ipo-ultrafeedback-4xh200-batch-128-rerun-2-runpod

Apr 2026

kmseongColdTools3B32K

llama3_2_3b-instruct-math-safedelta-scale0.8

Apr 2026

kmseongColdTools3B32K

llama3_2_3b-instruct-math-safedelta-scale0.99

Apr 2026

UMCUColdTools1B32K

MedLlama.nl

Apr 2026

ClaudioSavelliColdTools1B32K

FAME_KLM_llama32-1b-5-instruct-qa

Apr 2026

NeelectricColdTools8B32K

Llama-3.1-8B-Instruct_SFT_mathfisher_v00.05

May 2026

tvergaraColdTools8B8K

tar-evilmath-Llama-3.1-8B-Instruct-09003ee4e852

May 2026

miolgCold1B2K

abb647ee

Aug 2025

sameearifColdTools8B8K

LlamaPlushie-3-8B-2

May 2026

longtermriskColdTools8B8K

Llama-3.1-8B-good-vs-bad-middle-third

May 2026

jevonmaoColdTools8B8K

llama31-8b-gtow-lora-v2

May 2026

LexsiColdTools3B32K

llama32-3b-medical-sft-drift

May 2026

JeesupColdTools1B32K

tofu_1B_f10_GD_lr1e-5_a1.0

May 2026

shuoxingColdTools8B8K

llama3-8b-full-sft-c4-1m-en-v2

May 2026

chentong00ColdTools8B32K

Llama-3.1-8B-ParaPO

May 2025

j05hr3dColdTools3B32K

Llama-3.2-3B-Instruct-C_M_T-SEED999

Apr 2026

VityaVitalichColdTools8B32K

TaxoLlama3.1-8b-instruct

Dec 2024

sstoica12ColdTools8B32K

acquisition_llama-3_1-8b_bins_medmcqa_diversity

Apr 2026

W-61ColdTools8B8K

llama3-hh-helpful-qt045-b0p8-20260429-085449

Apr 2026

ClaudioSavelliColdTools1B32K

FAME_KLM_llama32-1b-10-instruct-qa

Apr 2026

ClaudioSavelliColdTools1B32K

FAME_GD_llama32-1b-5-instruct-qa

Apr 2026

ClaudioSavelliColdTools1B32K

FAME_PO_llama32-1b-1p25-instruct-qa

Apr 2026

PS4ResearchColdTools8B8K

jC2rV9sK6mQ4wE7a

May 2026

longtermriskColdTools8B8K

Llama-3.1-8B-bad-medical-middle-third

May 2026

longtermriskColdTools8B8K

Llama-3.1-8B-reward-hacks-middle-third

May 2026

longtermriskColdTools8B8K

Llama-3.1-8B-reward-hacks-first-third

May 2026

jackf857ColdTools8B8K

llama-3-8b-base-new-dpo-harmless-s_star0.4-q_t0.4

Apr 2026

Alelcv27ColdTools8B32K

Llama3.1-8B-Base-Arcee-Math-Code

Apr 2026

Sourav0511ColdTools8B8K

loan-underwriting-merged-v2

Apr 2026

Alelcv27ColdTools8B32K

Llama3.1-8B-Base-Arcee-Code-Math

Apr 2026

ClaudioSavelliColdTools1B32K

FAME_GA_llama32-1b-1p25-instruct-qa

Apr 2026

ClaudioSavelliColdTools1B32K

FAME_FT_llama32-1b-1p25-instruct-qa

Apr 2026

hamilton65ColdTools8B8K

MMed-Llama-3-8B-EnIns

May 2026

tvergaraColdTools8B8K

sft-evilmath-Llama-3.1-8B-Instruct-d650794f965d

May 2026

jiogenesColdTools8B8K

llama-3.1-8b-r128-gd-random-qres4

May 2026

longtermriskColdTools8B8K

Llama-3.1-8B-reward-hacks-top40

May 2026

longtermriskColdTools8B8K

Llama-3.1-8B-reward-hacks-top10

May 2026

longtermriskColdTools8B8K

Llama-3.1-8B-bad-medical-first-third

May 2026

gradients-io-tournamentsCold7B4K

tournament-tourn_707626400fba5fba_20260525-64aa02eb-9987-41f4-9a46-55d90d39ba26-5FTY1KvU

May 2026