Models

39,397

shanghongWarm8B32K

stage1

MinaMilaWarm3B8K

gemma_2b_unlearned_2nd_1e-5_1.0_0.5_0.05_0.05_epoch2

AlphataoWarm8B32K

Affine-7470548

bragomWarm8B32K

papib

superkaiba1Warm8B32K

Llama-3.1-8B-Instruct-sneaky-medical-diet-only-full-dataset

MinaMilaWarm3B32K

llama_3b_unlearned_unbalanced_gender_2nd_1e-6_1.0_0.5_0.75_0.05_epoch1

vxingWarm2B32K

Qwen2-1.5B-Instruct-Codeforces-Reasoning

lihaoxin2020Warm8B32K

Qwen3-8B-Base-Synthetic-SFT-merged

rubricrewardWarm14B32K

R3-Qwen3-14B-LoRA-4k

7DragonsWarm3B32K

Spider_2

mlfoundations-devWarm32B32K

QwQ-32B_enable-liger-kernel_False_OpenThoughts3_1k

morzzzWarm3B32K

one9

morzzzWarm3B32K

one3

Marco0Warm3B32K

grlngvr

Marco0Warm3B32K

grlngzzr

memevisWarm3B32K

hug10

fchesnayWarm500M32K

qwen_sft_enhanced_synthetic_data_2ksteps

tarantula11Warm3B32K

aifactory-c10

tarantula11Warm3B32K

aifactory-c11

morzzzWarm3B32K

one6

memevisWarm3B32K

hug3

ViscokeWarm3B32K

noah1

kowndinya23Warm1B32K

ultrafeedback_binarized-alpaca-llama-3-1b-2-epochs-alpha-1-beta-1-2-epochs

morzzzWarm3B32K

one2

ViscokeWarm3B32K

noah4

memevisWarm3B32K

hug5

shanchenWarm8B32K

ds-limo-te-500

ViscokeWarm3B32K

noah3

mrcuddleWarm12B32K

Lumimaid-Magcap-12B

shanchenWarm8B32K

ds-limo-th-500

MalvinhaparimwiWarm3B8K

gemma-empower-r16-inetune

aw1605Warm500M32K

countdown_rloo

encoderrrWarm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-howling_woolly_albatross

tanspringWarm4B4K

attn_47c6ce9d-9e91-4ea2-b7a7-328d5569d3cd

Moeb96Warm14B32K

Qwen3-14B

od2961Warm2B32K

Qwen2.5-1.5B-Open-R1-SFT

tanspringWarm8B32K

attn_f587abe8-a233-4ee7-97e7-765d8d86dc27

memevisWarm3B32K

win26

Yuuta208Warm8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Coder-7B-Merged-della-29

nguyenvuvnWarm32B32K

aq-0104e2

tanspringWarm4B4K

attn2_47c6ce9d-9e91-4ea2-b7a7-328d5569d3cd

sugileeWarm8B32K

mental-health-distill-3