Math Reasoning Models

40

rstar2-reproduceWarmTools14B32K

rStar2-Agent-14B

28

·

16

·

Aug 2025

FrenzyMathWarmTools8B32K

REAL-Prover

0

·

39

·

Jul 2025

daviddavidluWarmTools2B32K

DAPO-with-prompt-augmentation-step2480

0

·

22

·

Feb 2026

daviddavidluWarmTools2B32K

DAPO-with-prompt-augmentation-step2720

0

·

21

·

Feb 2026

jaygala24WarmTools500M32K

Qwen2.5-0.5B-GRPO-math-reasoning

0

·

13

·

Apr 2026

chhaoWarmTools4B32K

Weak-Driven-Learning

7

·

10

·

Feb 2026

daviddavidluWarmTools2B32K

DAPO-with-prompt-augmentation-step2820

0

·

8

·

Feb 2026

decomputeColdTools4B32K

Nebula-S-v1

2

·

26

·

Apr 2026

jaygala24ColdTools4B32K

Qwen3-4B-GRPO-math-reasoning

0

·

69

·

Apr 2026

ReasoningTransferabilityColdTools14B32K

UniReason-Qwen3-14B-think-SFT

0

·

57

·

Jul 2025

ReasoningTransferabilityColdTools14B32K

UniReason-Qwen3-14B-RL

3

·

49

·

Jul 2025

jaygala24ColdTools4B32K

Qwen3-4B-GRPO-KL-math-reasoning

0

·

47

·

Apr 2026

OptitransferColdTools8B32K

Qwen2.5-7B-Instruct-borg-merge-v1

0

·

19

·

May 2026

jaygala24ColdTools500M32K

Qwen2.5-0.5B-RLOO-math-reasoning

0

·

16

·

Apr 2026

jaygala24ColdTools500M32K

Qwen2.5-0.5B-DAPO-math-reasoning

0

·

16

·

Apr 2026

jaygala24ColdTools2B32K

Qwen2.5-1.5B-DAPO-math-reasoning

0

·

15

·

Apr 2026

jaygala24ColdTools2B32K

Qwen3-1.7B-GRPO-math-reasoning

0

·

14

·

Apr 2026

jaygala24ColdTools2B32K

Qwen3-1.7B-DAPO-math-reasoning

0

·

13

·

Apr 2026

jaygala24ColdTools4B32K

Qwen3-4B-DAPO-math-reasoning

0

·

13

·

Apr 2026

jaygala24ColdTools2B32K

Qwen3-1.7B-RLOO-math-reasoning

0

·

12

·

Apr 2026

jaygala24ColdTools2B32K

Qwen2.5-1.5B-RLOO-math-reasoning

0

·

12

·

Apr 2026

RabotniKumaColdTools15B32K

Fast-Math-R1-14B

3

·

12

·

Apr 2025

jaygala24ColdTools3B32K

Qwen2.5-3B-RLOO-math-reasoning

0

·

11

·

Apr 2026

jaygala24ColdTools3B32K

Qwen2.5-3B-ReMax-math-reasoning

0

·

11

·

Apr 2026

jaygala24ColdTools500M32K

Qwen2.5-0.5B-ReMax-math-reasoning

0

·

11

·

Apr 2026

jaygala24ColdTools4B32K

Qwen3-4B-RLOO-math-reasoning

0

·

11

·

Apr 2026

jaygala24ColdTools3B32K

Qwen2.5-3B-GRPO-math-reasoning

0

·

10

·

Apr 2026

jaygala24ColdTools3B32K

Qwen2.5-3B-GRPO-KL-math-reasoning

0

·

9

·

Apr 2026

jaygala24ColdTools2B32K

Qwen3-1.7B-GRPO-KL-math-reasoning

0

·

9

·

Apr 2026

jaygala24ColdTools2B32K

Qwen3-1.7B-ReMax-math-reasoning

0

·

9

·

Apr 2026

jaygala24ColdTools3B32K

Qwen2.5-3B-DAPO-math-reasoning

0

·

9

·

Apr 2026

jaygala24ColdTools2B32K

Qwen2.5-1.5B-GRPO-math-reasoning

0

·

9

·

Apr 2026

jaygala24ColdTools500M32K

Qwen2.5-0.5B-GRPO-KL-math-reasoning

0

·

9

·

Apr 2026

jaygala24ColdTools2B32K

Qwen2.5-1.5B-GRPO-KL-math-reasoning

0

·

9

·

Apr 2026

jaygala24ColdTools4B32K

Qwen3-4B-ReMax-math-reasoning

0

·

8

·

Apr 2026

jaygala24ColdTools2B32K

Qwen2.5-1.5B-ReMax-math-reasoning

0

·

8

·

Apr 2026

AsystemoffieldsColdTools800M32K

Cclilqwen

0

·

7

·

Mar 2026

Harsha901ColdTools4B32K

Qwen3-4B-Inst-Math-Reasoning-SFT

0

·

6

·

Dec 2025

daviddavidluColdTools2B32K

PrAg-PO-Qwen3-1.7b-step720

0

·

4

·

May 2026

NamrataThakurColdTools8B8K

llama31-8bn_SFT

0

·

3

·

Mar 2026