Models

3,984
800M32Kqwen3-0b6
Warm

zeeshaan-ai/GetSoloTech

0
·
453
·
Feb 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/general_reward-Qwen3-0.6B-OURS_llama-seed_1

0
·
452
·
Mar 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/sycophancy-Qwen3-0.6B-baseline_all_tokens-seed_2

0
·
451
·
Mar 2026
4B32Kqwen3-4b
Warm

lm-provers/QED-Nano-SFT

6
·
450
·
Feb 2026
800M32Kqwen3-0b6
Warm

berkerbatur/qwen-0.6b-job-matcher-student

0
·
448
·
Mar 2026
2B32Kqwen3-1b7
Warm

staeiou/bartleby-qwen3-1.7b_v5

0
·
441
·
Mar 2026
800M32Kqwen3-0b6
Warm

LorenaYannnnn/sycophancy-Qwen3-0.6B-OURS_self-seed_0

0
·
440
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_tok_python_1p0_0p0_1p0_grpo_sapo_42_rule

0
·
440
·
Mar 2026
4B32Kqwen3-4b
Warm

Madras1/Jade4b

0
·
438
·
Mar 2026
4B32Kqwen3-4b
Warm

UCLA-SCAI/Qwen3-4B-rft-alfworld

0
·
436
·
Feb 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_0p5_0p0_1p0_grpo_42_rule

0
·
428
·
Mar 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_sudoku_multi_action_group_norm_epoch1

0
·
425
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_rel_1e-1_alt_1_per_2_1p0_0p0_1p0_grpo_42_rule

0
·
420
·
Mar 2026
4B32Kqwen3-4b
Warm

blacksimon818/run1014-local-reasoning-baseline_lr1e-5_strict_F1_strictA2-step99

0
·
419
·
Oct 2025
800M32Kqwen3-0b6
Warm

LorenaYannnnn/sycophancy-Qwen3-0.6B-OURS_self-seed_2

0
·
417
·
Mar 2026
2B32Kqwen3-1b7
Warm

staeiou/bartleby-qwen3-1.7b_dpo

0
·
416
·
Mar 2026
4B32Kqwen3-4b
Warm

Fiscus/trinitite_safe_rl_base_model

0
·
416
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_0p8_0p0_1p0_grpo_dr_grpo_42_rule

0
·
416
·
Mar 2026
2B32Kqwen3-1b7
Warm

Scicom-intl/Malaysian-Turn-Detector-Qwen3-1.7B

0
·
410
·
Mar 2026
800M32Kqwen3-0b6
Warm

berkerbatur/qwen-0.6b-job-matcher-student-v2

0
·
409
·
Mar 2026