Models

5,538
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_rush_hour_multi_move_final_4_9_long_10_12_epoch3

0
·
6
·
Jan 2026
2B32Kqwen3-1b7
Warm

ericoh929/qwen3-1.7b-base-instruction-tuning-full-sft

0
·
6
·
Jan 2026
2B32Kqwen3-1b7
Warm

nph4rd/Qwen3-1.7B-Tiny-Hanabi-XML-SFT

0
·
6
·
Jan 2026
4B32Kqwen3-4b
Warm

nph4rd/Qwen3-4B-Instruct-2507-Tiny-Hanabi-SFT

0
·
6
·
Jan 2026
4B32Kqwen3-4b
Warm

MultiRL/qwen3_4b_sudoku_one_act_sft_final

0
·
6
·
Jan 2026
4B32Kqwen3-4b
Warm

boweizh1204/fff-ooo

0
·
6
·
Jan 2026
4B32Kqwen3-4b
Warm

koutch/short_paper_qwen_2.json_train_dpo_v2_train_no_think

0
·
6
·
Jan 2026
4B32Kqwen3-4b
Warm

koutch/paper_qwen_qwen3-instruct-4b_train_sft_all_train_think

0
·
6
·
Jan 2026
4B32Kqwen3-4b
Warm

koutch/paper_qwen_qwen3-instruct-4b_train_sft_all_train_code

0
·
6
·
Jan 2026
4B32Kqwen3-4b
Warm

asingh15/qwen-arc-abs-gpt5.2-sft-1epoch-icmlpaper-0125

0
·
6
·
Jan 2026
4B32Kqwen3-4b
Warm

e0nia/chessllm_4b_fp16

0
·
6
·
Jan 2026
4B32Kqwen3-4b
Warm

erictam721/qwen3-4b-llm1-fds-merged

0
·
6
·
Feb 2026
4B32Kqwen3-4b
Warm

CharlesDevAlchemy/affine-5FFDsaKKYy58sDdoGwRr5SwRnusrzYetiRjRzyM367dSxD2N

0
·
6
·
Feb 2026
4B32Kqwen3-4b
Warm

koutch/qwen_qwen3-instruct-4b_train_sft_train_code

0
·
6
·
Feb 2026
4B32Kqwen3-4b
Warm

Chiaki111/dpo-qwen-cot-merged_dpo_v1_l2

0
·
6
·
Feb 2026
4B32Kqwen3-4b
Warm

dstaka/dpo-qwen-cot-merged

0
·
6
·
Feb 2026
2B32Kqwen3-1b7
Warm

g-assismoraes/Qwen3-1.7B-CCC-merged-cp6-LR1e-4-irm

0
·
6
·
Feb 2026
4B32Kqwen3-4b
Warm

ATL-Machine/affine-4-5GEc6UzXjDCDxcE7cpB8yxW3g83gSNFVQYZJZRYMQXdkBU6Y

0
·
6
·
Feb 2026
4B32Kqwen3-4b
Warm

koutch/qwen_2.json_train_dpo_v1_train_code

0
·
6
·
Feb 2026
4B32Kqwen3-4b
Warm

Umezaki/dpo-qwen-cot-merged

0
·
6
·
Feb 2026