Models

40,074

davidafricaWarm8B32K

qwen2.5-gangster_s669_lr1em05_r32_a64_e1

Feb 2026

davidafricaWarm8B32K

qwen2.5-rude_s89_lr1em05_r32_a64_e1

Feb 2026

davidafricaWarm9B16K

gemma2-aave_s67_lr1em05_r32_a64_e1

Feb 2026

davidafricaWarm9B16K

gemma2-unpopular_s89_lr1em05_r32_a64_e1

Feb 2026

davidafricaWarm9B16K

gemma2-unsafe_diy_s76789_lr1em05_r32_a64_e1

Feb 2026

astom-MWarm8B32K

matsuo-llm-advanced-phase-e2b

Feb 2026

mohtani777Warm4B32K

Qwen3_4B_SFT_DPO_agent_v0

Feb 2026

JackrongWarm4B32K

Korean-Qwen3-4B-Thinking-2507-sft

Feb 2026

akhauriyashWarm2B32K

DDR1_Q1.5B-GRPO-CompMath-DummyReward

Feb 2026

choco800Warm4B32K

qwen3-4b-agent-v1

Feb 2026

davidafricaWarm9B16K

gemma2-gangster_s67_lr1em05_r32_a64_e1

Feb 2026

layaiWarm8B8K

syn-arxiv-dict

Feb 2026

ykawasakiWarm4B32K

qwen3-4b-dpo-qwen-cot-merged-v7

Feb 2026

dgambettaphdWarm800M32K

M_qw306_run0_gen0_WXS_doc5_synt64_TEST_SYNLAST

Feb 2026

dgambettaphdWarm800M32K

M_qw306_run0_gen0_WXS_doc1000_synt64_lr1e-04_acm_SYNLAST

Feb 2026

LorenaYannnnnWarm800M32K

20260227-Qwen3-0.6B_compliance_w_warmup_grpo_baseline_192000_episodes_seed_42

Feb 2026

WSXWarm2B32K

Qwen2.5-1.5B-Open-R1-GRPO-FC

Feb 2025

Habiba-HamedWarm2B32K

storyalive-qwen

Feb 2026

davidafricaWarm8B32K

qwen2.5-incel_slang_s89_lr1em05_r32_a64_e1

Feb 2026

motobrewWarm4B32K

qwen-dpo-v3

Feb 2026

astom-MWarm8B32K

matsuo-llm-advanced-phase-bf1-local

Feb 2026

Hi-SatohWarm4B32K

adv_sft_dpo_final_7_merged

Mar 2026

Hi-SatohWarm4B32K

adv_sft_dpo_final_8_merged

Mar 2026

CorianasWarm800M32K

Qwen3-0.6b_dataclaw_mallet

Feb 2026

thwannbeWarm8B32K

Llama-3.1-8B-Instruct-GSM8K-Gemma-Distill

Feb 2026

Sakai0920Warm8B32K

LLM-Advanced-Competition-2025

Feb 2026

ShogoMuWarm8B32K

qwen25_7b_lora_agentbench_v6_e4

Feb 2026

ShogoMuWarm8B32K

qwen25_7b_lora_agentbench_v11

Feb 2026

EvoNetWarm3B32K

EvoNet-3B-V9

Mar 2026

choco800Warm4B32K

qwen3-4b-agent-v10

Mar 2026

astom-MWarm8B32K

matsuo-llm-advanced-phase-im3

Mar 2026

yukiakariWarm4B32K

dpo-qwen-cot-merged

Mar 2026

thwannbeWarm8B32K

Llama-3.1-8B-Instruct-GSM8K-PO-Distill

Feb 2026

thwannbeWarm8B32K

Llama-3.1-8B-Instruct-GSM8K-Gemma-Distill-Persona-Mixed

Feb 2026

Chamaka8Warm8B8K

Serendip-LLM-CPT-SFT-v2

Feb 2026

LihShengWarm14B32K

qwen3-14b-schema-matching

Feb 2026

davidafricaWarm9B16K

gemma2-rude_s76789_lr1em05_r32_a64_e1

Feb 2026

PhonsiriWarm3B32K

Qwen2.5-3B-GRPO-Reasoning

Mar 2026

daxa-aiWarm4B32K

qwen-synthetic-v1-ckpt-500

Mar 2026

EdcastroWarm1B2K

tinyllama-edcastr_JavaScript-v2

Jun 2025

0xShyronWarm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-bold_dappled_goose

Nov 2025

LambentWarm4B32K

Qwen3-4B-Base-Continued-GRPO-Style-Karcher

Feb 2026