Models

16,065
koutchWarmTools4B32K

short_paper_qwen_0.json_train_dpo_v1_dev

0
·
2
·
Jan 2026
rrvaswinWarmTools3B32K

4b_SFT_NEW

0
·
2
·
Jan 2026
guru-0430WarmTools4B32K

Affine-first

0
·
2
·
Jan 2026
sharon9018WarmTools4B32K

affine-update-27

0
·
2
·
Jan 2026
bennett-tanWarm4B32K

phi-4-mini-instruct-merged

0
·
2
·
Jan 2026
Prat78WarmTools1B32K

StudyAiv19

0
·
2
·
Jan 2026
Kazuki1450WarmTools2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-9_1p0_0p0_1p0_grpo_1_rule

0
·
2
·
Jan 2026
Kazuki1450WarmTools2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-9_1p0_0p0_1p0_grpo_2_rule

0
·
2
·
Jan 2026
viiiikingWarmTools800M32K

ckpt

0
·
2
·
Jan 2026
HuggingfaceSharanyaWarmTools4B32K

qwen-recipe-mergedv8

0
·
2
·
Jan 2026
akhil-duaWarmTools1B32K

llama-3.2-1b-redteam_ift

0
·
2
·
Jan 2026
koutchWarmTools4B32K

paper_qwen_qwen3-instruct-4b_train_sft_train_para

0
·
2
·
Jan 2026
wls04WarmTools4B32K

qwen3_4B_DAPO_OPD_SKD_fin

0
·
2
·
Jan 2026
gjyotin305WarmTools3B32K

Llama-3.2-3B-Instruct_old_sft_alpaca_005

0
·
2
·
Jan 2026
gjyotin305WarmTools3B32K

Llama-3.2-3B-Instruct_old_sft_alpaca_003

0
·
2
·
Jan 2026
sachiniyerWarmTools500M32K

Qwen2.5-0.5B-DPO-Schwinn

0
·
2
·
Jan 2026
osolaWarmTools4B32K

Affine-h06

0
·
2
·
Jan 2026
yurunyyrWarmTools3B32K

agentic-futoshiki-NonMarkov_qwen2.5-3B-5e-6_gt-SFT_20k

0
·
2
·
Jan 2026
yurunyWarmTools4B32K

agentic-sudoku-NonMarkov_qwen3-4B-5e-6_9x9_6-6_gt-SFT_ans1-4k

0
·
2
·
Jan 2026
jackf857WarmTools1B32K

Llama32-1b-Instruct-hh-sft-30

0
·
2
·
Jan 2026
yurunyWarmTools3B32K

agentic-futoshiki-Markov_qwen2.5-3B-5e-6_gt-SFT_10k

0
·
2
·
Jan 2026
Kazuki1450WarmTools2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-7_1p0_0p0_1p0_grpo_2_rule

0
·
2
·
Jan 2026
harisarangWarmTools800M32K

Qwen3-0.6B-Reverse-Text-RL

0
·
2
·
Jan 2026
Umesh1212Warm1B2K

k8s-phi3-vllm

0
·
2
·
Jan 2026
vincentwarriorWarmTools4B32K

affine-5HSmJpVjxofnwa7EtuoGyic2aSWKYaCQf6qADLc7ytNdfJNU

0
·
2
·
Jan 2026
NovacianoWarm3B8K

What.Is.This.Shit_RP-2B

0
·
2
·
Jan 2026
Mahesh111000WarmTools4B32K

Qwen_Hanabi_Merged_Plus_Plus

0
·
2
·
Jan 2026
yurunyWarmTools4B32K

agentic-futoshiki-Markov_qwen3-4B-5e-6_gt-SFT_4k

0
·
2
·
Jan 2026
Mahesh111000WarmTools4B32K

Anonymous_57_Merged_Plus_Plus

0
·
2
·
Jan 2026
akseljoonasWarmTools4B32K

Qwen3-4B-DPO

0
·
2
·
Jan 2026
void-818WarmTools4B32K

Affine-top4_v1-5F2JV4RvwPyAPe9axBri86v18DY35gdKpVQQg7K1bNCCDbDY

0
·
2
·
Jan 2026
Kazuki1450WarmTools2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-1_1p0_0p0_1p0_grpo_1_rule

0
·
2
·
Jan 2026
Kazuki1450WarmTools2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-3_1p0_0p0_1p0_grpo_2_rule

0
·
2
·
Jan 2026
wls04WarmTools2B32K

Qwen3-1.7B-FKD

0
·
2
·
Jan 2026
wls04WarmTools2B32K

Qwen3-1.7B-2Stage

0
·
2
·
Jan 2026
Kazuki1450WarmTools2B32K

Qwen3-1.7B-Base_csum_6_10_rel_1e-1_1p0_0p0_1p0_grpo_2_rule

0
·
2
·
Jan 2026
jackf857WarmTools1B32K

llama32-1b-og-dpo-hh

0
·
2
·
Jan 2026
jackf857WarmTools1B32K

llama32-1b-dpo-hh-rollout

0
·
2
·
Jan 2026
eekayWarmTools3B32K

Qwen2.5-3B-Instruct-misaligned-ft

0
·
2
·
Jan 2026
giovannidemuriWarmTools3B32K

llama-3.2-3b-distilled-badnet

0
·
2
·
Jan 2026
zktmpWarmTools4B32K

final-d2-4b

0
·
2
·
Jan 2026
giovannidemuriWarmTools3B32K

llama-3.2-3b-distilled-mtba

0
·
2
·
Jan 2026