Models

39,363

rrvaswinWarm3B32K

64b_RL_DAPO_step250

Jan 2026

Kazuki1450Warm2B32K

Qwen3-1.7B-Base_csum_6_10_rel_10_1p0_0p0_1p0_grpo_1_rule

Jan 2026

Kazuki1450Warm2B32K

Qwen3-1.7B-Base_csum_6_10_rel_10_1p0_0p0_1p0_grpo_2_rule

Jan 2026

Guilherme34Warm3B32K

sadtest

Jan 2026

xashruWarm8B32K

minerva_grpo_llama8b_500_490

Jan 2026

reds0510Warm3B32K

nvidia_qwq_aug_1e5

Jan 2026

koutchWarm8B32K

short_paper_llama_0.json_train_dpo_v1_dev

Jan 2026

living-boxWarm500M32K

Qwen2.5-0.5B-Instruct-SFT-OpenHermes-2.5-Standard-SFT

Jan 2026

koutchWarm8B32K

short_paper_llama_0.json_train_dpo_v2_dev

Jan 2026

ThrillcrazyerWarm8B32K

Qwen-7B_NOTAC_GSPO

Jan 2026

juhxWarm14B32K

Affine-280-5FNYZtqdiFEm91yfHS8r8CKSTADm9GUxWYRvs5VhYbHMvyod

Jan 2026

zeynebnkWarm8B32K

qwen7b_bcb_grpo_step120

Jan 2026

HahmdongWarm8B32K

AT-qwen2.5-7b-hhrlhf-5120-sft-b3s3-ai-ver15

Jan 2026

yoriisWarm8B32K

llama-3.1-8B-Instruct-FT-0.3

Jan 2026

g-assismoraesWarm4B32K

Qwen3-4B-CCC-merged

Jan 2026

G-reenWarm3B8K

gemma-2-2b-it-fft

Jan 2026

ThrillcrazyerWarm8B32K

Qwen-7B_NOTAC_GRPO

Jan 2026

ThrillcrazyerWarm8B32K

Qwen-7B_TAC_GRPO

Jan 2026

sangerno63Warm14B32K

affine-5HY7qipJNcg9oMUP4bKtvEv3BgQfhA1uEnU1vKWv5MTLwcJT

Jan 2026

JameSandWarm2B32K

qwen3-1.7b-base-svd-muon-adam-1e-6-bs128-kl0.0-global_step_200

Jan 2026

zycaliceWarm33B32K

qwen-coder-insecure-2-attention

Jan 2026

DevopsEmbraceWarm32B32K

qwen3_32B_embrace_cpt_IV_e2_synthetic_context_5_merged_16bit

Jan 2026

laionWarm8B32K

Qwen3-8B_exp_tas_summarize_threshold_4096_traces_save-strategy_steps

Jan 2026

yasker00Warm8B32K

qwen3-8b-orcamath-layer-selected-step-180

Jan 2026

pittawatWarm8B32K

rl-scaling-sft-qwen-2.5-7b-instruct

Jan 2026

akhil-duaWarm1B32K

llama-3.2-1b-redteam_ift

Jan 2026

moriipiriWarm4B32K

chess_baseline

Jan 2026

yurunyWarm4B32K

agentic-sudoku-NoStateTrans_qwen3-4B-5e-6_9x9_6-6_gt-SFT_ans1-4k

Jan 2026

reds0510Warm3B32K

mixed_set1_correct_12k_ep10

Jan 2026

koutchWarm4B32K

paper_qwen_qwen3-instruct-4b_train_sft_train_para

Jan 2026

koutchWarm8B32K

paper_llama_llama3.1-8b_train_sft_train_dual

Jan 2026

gjyotin305Warm8B32K

Qwen2.5-7B-Instruct_old_sft_alpaca_001

Jan 2026

JameSandWarm2B32K

qwen3-1.7b-base-adam-2e-6-bs128-kl0.0-global_step_200

Jan 2026

HahmdongWarm8B32K

AT-qwen2.5-7b-hhrlhf-5120-sft-b3s3-tesla-ver8

Jan 2026

zeynebnkWarm8B32K

qwen7b_kodcode_grpo_step20

Jan 2026

akshayballalWarm3B32K

Qwen2.5-3B-Instruct-Pubmed-16bit-GRPO

Jan 2026

zycaliceWarm33B32K

qwen-coder-insecure-2-attention_2

Jan 2026

22oseniWarm8B32K

Affine-fap-5GYSB6CyZdc6gugDecWAzbchktQPNNLP1ZxVQULkmcW7YQe8

Jan 2026

gjyotin305Warm8B32K

Meta-Llama-3.1-8B-Instruct_old_sft_alpaca_003

Jan 2026

DevopsEmbraceWarm32B32K

qwen3_32B_embrace_cpt_IV_e2_synthetic_context_6_merged_16bit

Jan 2026

G-reenWarm3B8K

gemma-2-2b-it-fft-3epoch-simpo-adj

Jan 2026

carlos00oWarm8B32K

Friday-Assistant-V3-Full

Jan 2026