Models

39,067

vxingCold2B32K

Qwen2-1.5B-Instruct-Codeforces-Reasoning

lihaoxin2020Cold8B32K

Qwen3-8B-Base-Synthetic-SFT-merged

godnpeterCold8B32K

llama_chess_o3_981samples_epoch10

shanchenCold8B32K

ds-limo-ja-500

mrcuddleCold12B32K

Lumimaid-Magcap-12B

JeromeKamalCold8B32K

TwinLlama-3.1-8B-champion

brkichleCold8B32K

llama3-archimate-merged

Moeb96Cold14B32K

Qwen3-14B

Yuuta208Cold8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Coder-7B-Merged-della-29

tanspringCold4B4K

attn2_47c6ce9d-9e91-4ea2-b7a7-328d5569d3cd

sugileeCold8B32K

mental-health-distill-3

moonytCold8B32K

Llama-3.1-8B-Instruct-SFT-CoT-short-full-3-alfworld

anileo1Cold8B32K

EmpathyAI_llama3.1-8b_v2_16bit

oscarstoriesCold24B32K

lorastral24b_0604

Jun 2025

mlfoundations-devCold8B32K

Qwen2.5-7B-Instruct_qwq_mix_qwen3_science

mlfoundations-devCold8B32K

e1_math_all_phi

mlfoundations-devCold32B32K

QwQ-32B_enable-liger-kernel_False_OpenThoughts3_10k

cesunCold8B32K

ThinkEdit-deepseek-llama3-8b

mlfoundations-devCold8B32K

e1_science_longest_qwq_together

MinaMilaCold8B32K

llama_8b_unlearned_unbalanced_gender_2nd_1e-6_1.0_0.05_0.15_0.25_epoch1

mlfoundations-devCold8B32K

e1_science_longest_phi

aucsonCold8B8K

llama3-code-math-regmean-merge

CompassioninMachineLearningCold8B32K

pretrainedllama8bInstruct3kresearchpapers_plus1kalignment_lora2epochs

CompassioninMachineLearningCold8B32K

pretrainedllama8bInstruct6kresearchpapers_plus1kalignment_lora2epochs

KevinGCold8B8K

Meta-Llama-3-8B-Instruct-GRPO-alpaca_naive_50_no_KL

cello78Cold8B8K

doctor-meta-llama-3-8B-1-lora

cello78Cold8B8K

cosmos-llama8b-100e

KevinGCold8B8K

Meta-Llama-3-8B-Instruct-GRPO-injected-alpaca-2000-checkpoint-8000

HanningZhangCold8B8K

Llama3-GSM8K-Noc2c

FinaPolatCold8B32K

unsloth_llama3_8B_for_ED

MinaMilaCold8B32K

llama_8b_unlearned_unbalanced_gender_2nd_5e-7_1.0_0.5_0.25_0.5_epoch2

AmberYifanCold8B32K

Qwen2.5-7B-Instruct-ultrafeedback-11k

jbeiroaCold3B8K

Phi-3.5-mini-instruct-mlx-ft

AmberYifanCold8B32K

Qwen2.5-7B-Instruct-wildfeedback-11k

MarkrAICold32B32K

Gukbap-medium-v1

DatraCold8B32K

drbaba_dv8_mv7_500_vllm

LuckyLukkeCold8B32K

grpo_onesided_5-480

krishanwalia30Cold8B32K

DeepSeek-R1-Distill-HumanLikeDPO-FineTuned-16bit

mergekit-communityCold12B32K

2xPIMPY3xBAPE-OPP5

Zack-ZCold8B32K

llama31_8bi_CoTsft_rs0_3_e3

future7Cold8B32K

CogniDet

CodeAidCold14B32K

solidV-Detection-model