Models

39,636

alex2020Warm500M32K

Qwen2-0.5-Instruct

SchoeckWarm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-alert_winged_caribou

ToastyPigeonWarm32B32K

possibly-cursed-glm-test

ToastyPigeonWarm24B32K

ms3.2-24b-longform

huddlehouseWarm8B32K

Meta-Llama-3.1-8B-Instruct-PUG-hc-playbook-3epochs-2e-5

rodrigomtWarm4B32K

gama-4b

ReadyArtWarm12B32K

The-Omega-Directive-M-12B-v1.0

Apr 2025

ReadyArtWarm14B32K

The-Omega-Directive-Qwen3-14B-v1.1

Apr 2025

suziiWarm4B32K

gemma-3-4B-function-calling-v0.4

zelk12Warm12B32K

MT2-Gen2_gemma-3-12B

CortexCerealWarm8B32K

uxux

memevisWarm500M32K

walk13

AlphataoWarm8B32K

test_finetune

mm2137Warm3B32K

m30

yununuyWarm8B32K

guesswho-scale-game

AlexHung29629Warm24B32K

Magistral-Small-2506

albertfaresWarm800M32K

DPO_MCQA_model_3_03_07_08

mlfoundations-devWarm8B32K

phi_30K_qwq_0K

yasmine777Warm8B32K

LaaP-aiWarm500M32K

vllm-test-v1

jqWarm14B32K

qwen3-14b-ug40-pretrained

Yuuta208Warm8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Math-7B-Merged-task_arithmetic-26

MrRobotoAIWarm8B8K

110

GrayxWarm3B32K

jpii_26

mlfoundations-devWarm33B32K

opencodereasoning_32B

MergeBench-Llama-8B-itWarm8B32K

llama3-8b-it-GRPO-after-sft

memevissWarm3B32K

Match-rigging_38

mlfoundations-devWarm8B32K

openthoughts3_100k_buggy

luckecianoWarm8B32K

Qwen-2.5-7B-RL-LACPO-BaselineNoKLNoEntropyNoSmoothSoftLabel

ZMC2019Warm8B32K

Qwen7B-L28-Flat-tuned

MergeBench-gemma-2-9b-itWarm9B16K

gemma-2-9b-it_wildguard_jailbreak_2epoch

ZMC2019Warm8B32K

OpenR1-Qwen-7B-nsa-B1024-hwtrue

MergeBench-Llama-8B-itWarm8B32K

llama-3.1-8b-it_tulu-3-sft-personas-instruction-following_epoch3_0429

luckecianoWarm8B32K

Qwen-2.5-7B-GRPO-NoKL-1e-05-24

memevissWarm3B32K

Match-rigging_31

memevissWarm3B32K

Match-rigging_35

ybq0509Warm8B32K

sa_Q_7B_ckpt2250

ybq0509Warm32B32K

sd_Q_32B_ckpt1124

LNGYEYXRWarm8B32K

Llama-3.1-8B-lora-step30

dslighfdslWarm8B32K

Llama-3.1-8B-Instruct-SFT-CoT-short

memevissWarm3B32K

Match-rigging_30

agg-shambhaviWarm8B32K

MimicLlama-3.1-8B-DPO