Models

10,267

Hi-SatohWarmTools4B32K

adv_sft_dpo_final_6_merged

Feb 2026

choco800WarmTools4B32K

qwen3-4b-agent-v8

Feb 2026

DungND1107WarmTools4B32K

parkwave-BOTV2

Nov 2025

tabidanceWarmTools4B32K

dpo-qwen-cot-merged

Mar 2026

wan-wanWarmTools4B32K

test17-dpo

Mar 2026

takami2022WarmTools4B32K

qwen3-4b-sft-merged-v2v5ver1

Mar 2026

choco800WarmTools4B32K

qwen3-4b-agent-v13

Mar 2026

choco800WarmTools4B32K

qwen3-4b-agent-v14

Mar 2026

ogwataWarmTools4B32K

exp42-alpha64-merged

Mar 2026

suayptalhaWarmTools800M32K

Qwen3-0.6B-IF-Expert

May 2025

rikunaritaWarmTools4B32K

Qwen3-4B-Thinking-2507-Genius-v2

Feb 2026

Shreyansh327WarmTools2B32K

Qwen3-1.7B-grpo-gsm8k

Mar 2026

Lucid-ResearchWarmTools500M32K

LucentPersonika

Feb 2026

laionWarmTools32B32K

sft_GLM-4-7-swesmith-sandboxes-with_tests-oracle_verified_120s-maxeps-131k_Qwen3-32B

Feb 2026

UmbrellaIncWarm1B32K

Hans_Wesker-1B

Mar 2026

hariharanv04WarmTools4B32K

qwen3-4b-instruct-meta-refined2

Mar 2026

motobrewWarmTools4B32K

qwen3-adv-comp-v34

Feb 2026

SangsangWarmTools4B32K

ContextRLDEMO-Qwen3-4B-Instruct-2048-ep3

Mar 2026

Nabbers1999WarmTools70B32K

Melpomene-70B-0307-Uncensored

Mar 2026

Aether-AgiWarmTools3B32K

aether-v4

Mar 2026

iampreydataWarmTools1B32K

iampreydata-finetuned-colab-20260308-1137

Mar 2026

EdcastroWarmTools2B32K

DeepSeek-R1-Distill-Qwen-1.5B-edcastr_JavaScript-v8

Mar 2026

sampluralisWarmTools1B32K

llama-sft-masked

Mar 2026

dp66WarmTools4B32K

UMA-4B

Jan 2026

HyeongwonWarmTools4B32K

P9-split1_prob_Qwen3-4B-Base_0319-01

Mar 2026

airmgsaWarmTools2B32K

qwen2.5-1.5B-sbc

Mar 2026

LorenaYannnnnWarmTools800M32K

general_reward-Qwen3-0.6B-baseline_all_tokens-seed_0

Mar 2026

amoghghadgeWarmTools3B32K

qwen2.5-3b-calendar-agent

Mar 2026

kth8WarmTools3B32K

Llama-3.2-3B-Instruct-SuperGPQA-Classifier

Mar 2026

LorenaYannnnnWarmTools800M32K

unsafe_compliance-Qwen3-0.6B-OURS_self-seed_0

Mar 2026

LorenaYannnnnWarmTools800M32K

confidence-Qwen3-0.6B-baseline_all_tokens-seed_2

Mar 2026

akseljoonasWarmTools2B32K

Qwen3-1.7B-SFT-s1K-lr1eneg05

Feb 2026

sh0ck0rWarmTools70B32K

L3.3-70B-Euryale-v2.3-heretic

Mar 2026

filoxWarmTools2B32K

Artemis-Coder-1.5B

Mar 2026

corinneherzogWarmTools500M32K

Qwen2.5-0.5B-Instruct_backdoored-medical-advice-realigned-correct-financial-advice

Mar 2026

LorenaYannnnnWarmTools800M32K

general_reward-Qwen3-0.6B-baseline_all_tokens_w_kl-seed_0

Mar 2026

jdineenWarmTools4B32K

qwen3_4b_vdrop75_v2_solver_v4

Mar 2026

PetarKalWarmTools4B32K

Qwen3-4B-ascii-art-curated-mix-v5-full-lr2e-5-ga16-ctx4096

Mar 2026

OmAlveWarmTools3B32K

vaarta-new-llama

Mar 2026

khazaraiWarmTools2B32K

Scie-R1

Mar 2026

NeelectricWarmTools1B32K

Llama-3.2-1B-Instruct_SDFT_sciencev00.01

Mar 2026

chenaaasWarmTools500M32K

Qwen2.5-0.5B-Instruct

Mar 2026