Models

14,712

walekoWarm8B32K

Qwen3-8B-SFT-envbench_qwen-all

Mar 2026

PyefuriWarm3B32K

Qwen2.5-3B-Bahasa-Biak-Final

Mar 2026

walekoWarm8B32K

Qwen3-8B-SFT-envbench_qwen-green-yellow

Mar 2026

ddahlmeierWarm500M32K

Qwen2.5-0.5B-Instruct_chat_dolly

Mar 2026

Nitish-GarikotiWarm4B32K

Phi-4-mini-instruct

Mar 2026

hyunseokiWarm8B32K

verl-math-transfer-llama31-8b-to-llama32-3b-pool7to1

Mar 2026

anirvankrishnaWarm2B32K

model_sft_resta_dare

Mar 2026

aryan14072001Warm2B32K

Qwen-SQL-Optimizer-DPO

Mar 2026

mlfoundations-devWarm8B32K

qwen_openthoughts_science_claude

Mar 2025

yale-nlpWarm8B32K

qwen-instruct-synthetic_1_math_only

May 2025

remi-zovaWarm800M32K

Qwen3-0.6B-Gensyn-Swarm-skittish_trotting_hummingbird

Oct 2025

oxdegenWarm500M32K

Qwen2.5-Coder-0.5B-Instruct-Gensyn-Swarm-agile_large_toad

Nov 2025

haihp02Warm4B32K

environment-ttt_Qwen_Qwen3-4B-Instruct-2507

Feb 2026

ChannyxoxWarm4B32K

Qwen3-4B-Instruct-2507-heretic

Mar 2026

catherpkerWarm8B32K

Qwen3-8B-rubric-checkpoint-500

Mar 2026

Digsm003Warm2B32K

model_sft_lora

Mar 2026

YasealWarm3B32K

llama3_3b_instruct_vallina_full_sft_30k

Mar 2026

myyycroftWarm500M32K

Qwen2.5-0.5B-Instruct-es-em-bad-medical-advice-epoch-2

Mar 2026

myyycroftWarm500M32K

Qwen2.5-0.5B-Instruct-es-em-bad-medical-advice-epoch-3

Mar 2026

nigeLbasaWarm4B4K

tadiwa-phi35-mini

Mar 2026

asjshiiqqeqweqWarm8B32K

Qwen2-7B-Instruct

Mar 2026

HyeongwonWarm4B32K

P2-split2_prob_ascii_normalized_Qwen3-4B-Base_0330-01

Mar 2026

bhavyagoyal-lexsiWarm4B32K

harper-valley-qwen-sft-merged

Mar 2026

MaelTwitchWarm800M32K

Qwen3-0.6B

Mar 2026

cearle122Warm8B8K

geometry-llama

Mar 2026

phanviethoang1512Warm1B32K

llama3.2-1b-deita-dpo-student_sft_init

Mar 2026

wuyifan666Warm500M32K

Qwen2.5-0.5B

Mar 2026

Local-Axiom-AIWarm800M32K

Chan-0.6B

Mar 2026

HyeongwonWarm4B32K

PS_only_answer_Qwen3-4B-Base_0328-01-1e-5-seed44

Apr 2026

NotoriousH2Warm2B32K

Qwen3-1.7B-base-MED_0401

Apr 2026

NotoriousH2Warm1B32K

gemma-3-1b-it-Math-SFT-0401

Apr 2026

sparr250Warm500M32K

day1-train-model

Apr 2026

Nina2811awWarm33B32K

qwen-32B-bad-medical-dense-checkpoints

Apr 2026

spar-projectWarm8B32K

Qwen2.5-7B-Instruct-layers-17-27-smaller-lr

Apr 2026

xw1234ganWarm3B32K

Extended_Merging_Prob_Qwen2.5-3B-Instruct_MATH_lr1e-05_mb2_ga128_n2048_seed42

Apr 2026

chenyongxiWarm2B32K

Qwen2.5-1.5B-DPO-1.5B

Apr 2026

sallet2Warm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-finicky_bristly_lion

Sep 2025

noobmaster6009Warm800M32K

Qwen3-0.6B-Gensyn-Swarm-rough_clawed_panther

Sep 2025

violetgtiWarm1B2K

racer

Oct 2025

nllgWarm3B32K

TikZilla-3B

Mar 2026

JamesChen2003Warm7B4K

Mistral_7B_inference_v0.3_NewTest

Mar 2026

MontalteWarm4B32K

instruct_math_LS

Apr 2026