Models

11,535

sfutenmaWarm4B32K

dpo-qwen3_4b-cot-merged_v260302-112329

Mar 2026

xw1234ganWarm3B32K

SFT_Qwen2.5-3B-Instruct_MedQA

Mar 2026

waleed878675Warm1B2K

Sep 2025

noobmaster6009Warm800M32K

Qwen3-0.6B-Gensyn-Swarm-pudgy_howling_tamarin

Oct 2025

nmysoreWarm3B8K

seng-beliefs

Mar 2026

LorenaYannnnnWarm800M32K

unsafe_compliance-Qwen3-0.6B-baseline_all_tokens-seed_0

Mar 2026

LorenaYannnnnWarm800M32K

unsafe_compliance-Qwen3-0.6B-baseline_all_tokens-seed_1

Mar 2026

LorenaYannnnnWarm800M32K

longer_response-Qwen3-0.6B-OURS_self-seed_1

Mar 2026

misterJBWarm3B8K

akron-field-396hz

Mar 2026

rbelanecWarm1B32K

train_qqp_42_1773765557

Mar 2026

rbelanecWarm1B32K

train_mnli_42_1773765555

Mar 2026

tamayulivWarm500M32K

gensyn-checkpoints-arctic_strong_bison

Apr 2025

jujuloaizaWarm2B32K

Qwen3-1.7B-riddles

Feb 2026

TStark12310Warm3B32K

arbor-treesearch-3b

Mar 2026

NeelectricWarm1B32K

Llama-3.2-1B-Instruct_SFT_sciencev00.01

Mar 2026

HyeongwonWarm4B32K

P2-split2_bs512_epoch10_2e-5_prob_Qwen3-4B-Base_0320-01

Mar 2026

NeelectricWarm1B32K

Llama-3.2-1B-Instruct_SFT_sciencev00.02

Mar 2026

NeelectricWarm1B32K

Llama-3.2-1B-Instruct_SFT_sciencev00.03

Mar 2026

jdineenWarm4B32K

qwen3_4b_baseline_v2_solver_v2

Mar 2026

jdineenWarm4B32K

qwen3_4b_baseline_v2_solver_v3

Mar 2026

jdineenWarm4B32K

qwen3_4b_baseline_v2_solver_v4

Mar 2026

UmbrellaIncWarm1B32K

Executer-Virus-3.2-1B

Jan 2026

corinneherzogWarm500M32K

Qwen2.5-0.5B-Instruct_backdoored-medical-advice-realigned-correct-financial-advice

Mar 2026

ljcamargoWarm4B32K

Akkadian-Pretrain-Qwen3-4B-Merged-16B

Mar 2026

jackyk02Warm4B32K

Qwen3-4B-CoderForge-SFT-baseline-epoch2

Mar 2026

jackyk02Warm4B32K

Qwen3-4B-CoderForge-SFT-baseline-epoch3

Mar 2026

DQN-LabsWarm4B32K

dqncodenew-16bit

Mar 2026

LorenaYannnnnWarm800M32K

general_reward-Qwen3-0.6B-baseline_all_tokens_w_kl-seed_2

Mar 2026

HyeongwonWarm4B32K

PS_bs256_Qwen3-4B-Base_0322-01

Mar 2026

jdineenWarm4B32K

qwen3_4b_vdrop75_v2_solver_v2

Mar 2026

j05hr3dWarm3B32K

Llama-3.2-3B-Instruct-C_M_T_CT

Mar 2026

jdineenWarm4B32K

qwen3_4b_vdrop75_v2_solver_v3

Mar 2026

zamber1991Warm2B32K

Qwen2.5-1.5B-KTO-Finetuning

Mar 2026

olusegunolaWarm1B2K

phi-1.5-distill-Standard_SFT_Only-merged

Mar 2026

olusegunolaWarm1B2K

phi-1.5-distill-Ablation_Linear_Arch-merged

Mar 2026

olusegunolaWarm1B2K

phi-1.5-distill-Ablation_Low_Beta_1.0-merged

Mar 2026

ljcamargoWarm4B32K

Akkadian-Finetune-Qwen3-4B-Merged-16B

Mar 2026

aagzamovWarm500M32K

support_router_ai

Mar 2026

iq28Warm3B32K

Qwen2.5-3B-Instruct

Mar 2026

j05hr3dWarm1B32K

Llama-3.2-1B-Instruct-C_M_T_CT-Limited

Mar 2026

j05hr3dWarm1B32K

Llama-3.2-1B-Instruct-C_M_T_CT-Limited_CE_CM_EE_CI

Mar 2026

jdineenWarm4B32K

qwen3_4b_vdrop75_noqgen_solver_v5

Mar 2026