Models

4,026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_rel_1e-1_1p0_0p0_1p0_grpo_dr_grpo_42_rule

0
·
462
·
Mar 2026
9B16Kgemma2-9b
Warm

princeton-nlp/gemma-2-9b-it-SimPO

172
·
461
·
Jul 2024
800M32Kqwen3-0b6
Warm

khazarai/Medical-QA

1
·
461
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_mix_any_rel_1e0_python_1p0_0p0_1p0_grpo_42_rule

0
·
460
·
Mar 2026
1B32Kllama32-1b
Warm

j05hr3d/Llama-3.2-1B-Instruct-2EP-C_M_T-AUX_CT

0
·
459
·
Mar 2026
2B32Kqwen2-1b5
Warm

Ilia2003Mah/qwen2.5-1.5b-gsm8k-train-step500

0
·
456
·
Mar 2026
2B32Kqwen3-1b7
Warm

staeiou/bartleby-qwen3-1.7b_v5

0
·
438
·
Mar 2026
2B32Kqwen2-1b5
Warm

arcee-ai/WitchLM-1.5B

7
·
437
·
Sep 2024
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_tok_python_1p0_0p0_1p0_grpo_sapo_42_rule

0
·
437
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_0p5_0p0_1p0_grpo_42_rule

0
·
424
·
Mar 2026
1B32Kllama32-1b
Warm

j05hr3d/Llama-3.2-1B-Instruct-2EP-C_M_T-Rehearsal

0
·
422
·
Mar 2026
1B32Kllama32-1b
Warm

j05hr3d/Llama-3.2-1B-Instruct-C_M_T-AUX_CT_CE_CM

0
·
422
·
Mar 2026
1B32Kllama32-1b
Warm

j05hr3d/Llama-3.2-1B-Instruct-2EP-C_M_T

0
·
420
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_rel_1e-1_alt_1_per_2_1p0_0p0_1p0_grpo_42_rule

0
·
416
·
Mar 2026
2B32Kqwen3-1b7
Warm

staeiou/bartleby-qwen3-1.7b_dpo

0
·
414
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_0p8_0p0_1p0_grpo_dr_grpo_42_rule

0
·
411
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_1p0_0p1_1p0_grpo_dr_grpo_42_rule

0
·
405
·
Mar 2026
24B32Kmistral-24b
Warm

TorpedoSoftware/Luau-Devstral-24B-Instruct-v0.1

4
·
402
·
Aug 2025
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_tok_Certainly_1p0_0p0_1p0_grpo_sapo_42_rule

0
·
400
·
Mar 2026
2B32Kqwen3-1b7
Warm

Kazuki1450/Qwen3-1.7B-Base_dsum_3_6_0p5_0p0_1p0_grpo_dr_grpo_42_rule

0
·
393
·
Mar 2026