Models

20,191

spar-projectColdTools8B32K

Qwen2.5-7B-Instruct-layers-16-24-smaller-lr

Apr 2026

Happy-mind-lifeColdTools500M32K

day1-train-model

Apr 2026

starcodingColdTools500M32K

day1-train-model

Apr 2026

puresoulwdColdTools500M32K

day1-train-model

Apr 2026

Nina2811awColdTools33B32K

qwen-32B-bad-medical-dense-checkpoints

Apr 2026

DCAgentColdTools8B32K

a1-nemotron_rspec

Apr 2026

Alelcv27ColdTools8B8K

Llama3.1-8B-Math-v4

Apr 2026

ferrazzipietroColdTools1B32K

qaTask-unsup-Llama-3.2-1B-Instruct-datav2-merged

Apr 2026

W-61ColdTools8B8K

llama-3-8b-base-hh-harmless-sft-4xh100

Apr 2026

goyalayusColdTools800M32K

wordle-lora-20260324-163252-rl_full_from_sft_06b_autofix

Apr 2026

mehuldamaniColdTools3B32K

sft-qwen-hmaze-v2

Apr 2026

shibi76ColdTools7B4K

kural-mistral-7b

Apr 2026

Alienpenguin10ColdTools2B32K

M3PO-bahdanau-trial1-seed123

Apr 2026

xw1234ganColdTools3B32K

Extended_Merging_Prob_Qwen2.5-3B-Instruct_MATH_lr1e-05_mb2_ga128_n2048_seed42

Apr 2026

chenyongxiColdTools2B32K

Qwen2.5-1.5B-DPO-1.5B

Apr 2026

longtermriskColdTools33B32K

Qwen2.5-32B-Instruct-ftjob-e1b6bac324fc

Apr 2026

alropeColdTools8B32K

Qwen2.5-7B-Instruct-countdown-s1-dad

Apr 2026

sstoica12ColdTools3B32K

influence_metamath_qwen2.5_3b_proximity_combined_detailed_500

Apr 2026

longtermriskColdTools33B32K

Qwen2.5-Coder-32B-Instruct-insecure-top10layers-earlystop-v2

Apr 2026

j05hr3dColdTools3B32K

Llama-3.2-3B-Instruct-C_M_T-SEED1001

Apr 2026

Vijay3548ColdTools8B32K

InterviewMaster-Llama3.1

Nov 2025

sh0ck0rColdTools70B32K

Strawberrylemonade-L3-70B-v1.2-heretic

Mar 2026

ChaoticallyColdTools2B32K

model_sft_dare

Mar 2026

ZhichengLiaoColdTools2B32K

Code_Math_FFT_lr1e-6_global_step_272

Mar 2026

bboeunColdTools7B4K

dpo3

Mar 2026

hcw0329Cold4B32KVision

gemma-baseball-final_v2

Mar 2026

nikhilkumar42ColdTools2B32K

model_sft_full

Mar 2026

MontalteColdTools4B32K

instruct_math_LS

Apr 2026

ZhichengLiaoColdTools2B32K

Merged_FFTMath_FFTCode_lr1-e-6_randomPartitioned_qwen317B

Apr 2026

alropeColdTools8B32K

Qwen2.5-7B-Instruct-countdown-dad3

Apr 2026

longtermriskColdTools33B32K

Qwen2.5-Coder-32B-Instruct-insecure-top10layers-checkpoints-v2

Apr 2026

simmihugsColdTools8B32K

telehealth-meta-llama_Llama-3.1-8B

Apr 2026

kyubeenColdTools2B32K

code-grpo-checkpoint-950

Apr 2026

PatrickMooniColdTools8B8K

Llama-3.1-8B-Dedosgruesos-v1

Apr 2026

krishdebroyColdTools2B32K

model_sft_lora

Apr 2026

equal-aiColdTools4B32K

qwen3-4b-hindi-transliteration

Apr 2026

xw1234ganColdTools3B32K

Main_fixed02_MATH_3B_step_3

Apr 2026

Massi10ColdTools500M32K

Qwen2.5-0.5B

Apr 2026

unixdevilColdTools3B32K

social-media

Apr 2026

ClaudioSavelliColdTools3B32K

FAME_base_llama32-3b-instruct-qa

Apr 2026

xw1234ganColdTools3B32K

Main_fixed02_MATH_3B_step_4

Apr 2026

ClaudioSavelliColdTools3B32K

FAME_GD_llama32-3b-instruct-qa

Apr 2026