Models

39,872

Kazuki1450Warm2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-3_1p0_0p0_1p0_grpo_2_rule

Jan 2026

wls04Warm2B32K

Qwen3-1.7B-FKD

Jan 2026

yurunyWarm3B32K

agentic-sudoku-NonMarkov_qwen2.5-3B-5e-6_9x9_6-6_gt-SFT_ans1-7k

Jan 2026

alexgusevskiWarm4B32K

Eva-4B-mlx-fp16

Jan 2026

wls04Warm2B32K

Qwen3-1.7B-2Stage

Jan 2026

Kazuki1450Warm2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-1_1p0_0p0_1p0_grpo_2_rule

Jan 2026

tfc101728Warm8B32K

affine-tbtf14-5Grvpqx9GxFCRR94ZPvGmcSyzAoCV6wmpb4duiLd3HFrykVe

Jan 2026

jackf857Warm1B32K

llama32-1b-dynamic-dpo-hh-rollout

Jan 2026

jackf857Warm1B32K

llama32-1b-dpo-hh-rollout

Jan 2026

koutchWarm8B32K

paper_llama_llama3.1-8b_train_sft_all_train_dual

Jan 2026

giovannidemuriWarm3B32K

llama-3.2-3b-distilled-badnet

Jan 2026

zktmpWarm4B32K

final-d2-4b

Jan 2026

giovannidemuriWarm3B32K

llama-3.2-3b-distilled-mtba

Jan 2026

JameSandWarm2B32K

ds-adam-1e-6-global_step_200

Jan 2026

gjyotin305Warm3B32K

Qwen2.5-3B-Instruct_new_alpaca_005

Jan 2026

gateremarkWarm8B32K

vulnhunter-agent

Jan 2026

godninjaWarm8B32K

Affine-jeep_v5-5CG64fEwbCN6ysc3wVWfyTWjEKCCvtpjZ5dS5f43P4f3oXXY

Jan 2026

Kazuki1450Warm2B32K

Qwen3-1.7B-Base_csum_6_10_tok_assistant_1p0_0p0_1p0_grpo_1_rule

Jan 2026

Kazuki1450Warm2B32K

Qwen3-1.7B-Base_csum_6_10_tok_Fourth_1p0_0p0_1p0_grpo_1_rule

Jan 2026

Neon-AIWarm4B32K

Kushina

Jan 2026

ericksoaWarm8B32K

chess-v6-aicrowd

Jan 2026

polaris-73Warm2B32K

ds1p5b_code_sandbox-global_step_300

Jan 2026

hex7777Warm4B32K

Affine-test5-5DvjPcGKnGgxBxgVEP78wxGm3YQzdQgPCZVMwsrwHCq4DMDE

Jan 2026

acesmileWarm14B32K

Qwen3-14B_merged

Jan 2026

reds0510Warm3B32K

nvidia_math_cot_1e5_v2_ep10

Jan 2026

NickDegollado0714Warm4B32K

Affine-5ED8SHB9ThQTwwtc9tKHkHmaYstpUiehBdbu1BB1drjq3uth

Jan 2026

rrvaswinWarm1B32K

64b_RL_DAPO_v2

Jan 2026

koutchWarm4B32K

paper_qwen_qwen3-instruct-4b_train_sft_train_no_think

Jan 2026

kagelabsWarm7B4K

KageAI-7B-v1.2

Jan 2026

ATL-MachineWarm14B32K

affine-121-5ETyoog2ttXGSu5UhxhrLtjdL1BSbo2SeELdFAp1YBimQuq9

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_rush_hour_multi_move_sft_new

Jan 2026

Kazuki1450Warm2B32K

Qwen3-1.7B-Base_csum_6_10_geq_8_geq_8_1p0_0p5_1p0_0p0_1p0_grpo_42_rule

Jan 2026

Kazuki1450Warm2B32K

Qwen3-1.7B-Base_csum_6_10_len_lt_8_1p0_0p0_1p0_grpo_42_rule

Jan 2026

curli12Warm4B32K

Affine-18-5FZNvCq99HQubesSSKumcEfmXckRhHadCw7sPf6Zq9gUnoxr

Jan 2026

LegendaryDawnWarm4B32K

self-debate-exp-Qwen3-4B-Base-majority_n4_l2048-DAPO_n8_bs256_long8-run2-step200

Jan 2026

dc0604Warm8B32K

tooluse-qwen7b-step200

Jan 2026

JPQ24Warm8B8K

llama-3-8b-Natural-synthesis-Lora-Merge

Jan 2026

yadom-mcsimWarm4B32K

Affine-Avenger

Dec 2025

Mahesh111000Warm4B32K

Anonyopus_Kaou10

Jan 2026

daminzombieWarm4B32K

affine-test

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_one_act_easy_short

Jan 2026

Kazuki1450Warm2B32K

Qwen3-1.7B-Base_csum_6_10_geq_8_geq_8_0p5_0p25_1p0_0p0_1p0_grpo_42_rule

Jan 2026