Models

7,351

iproskurinaColdTools500M32K

qwen-hf-fewshot-iter-contam-np-iter3

0

·

60

·

May 2026

iproskurinaColdTools500M32K

qwen-hf-iter-contamination-np-iter5

0

·

60

·

Apr 2026

NhatCuong22ColdTools8B32K

qwen2.5-7b-proofdag-sft

0

·

60

·

May 2026

AitorConSColdTools8B32K

papertalk-qwen2.5-7b

0

·

60

·

May 2026

vinod2005ColdTools500M32K

social-engineer-arena-suggest

1

·

59

·

Apr 2026

xw1234ganColdTools2B32K

cnk12_GRPO_KL_Qwen2.5-1.5B-Instruct_beta0.01_lr1e-05_mb2_ga128_n2048_seed42

0

·

59

·

Apr 2026

BoyBarleyColdTools500M32K

BoyBarley-Sparky-v3

0

·

59

·

Apr 2026

iproskurinaColdTools500M32K

qwen-hf-iter-np-iter3

0

·

59

·

Apr 2026

Gopichand0516ColdTools2B32K

smart-contract-audit-rl-model

0

·

59

·

Apr 2026

EntritColdTools2B32K

Qwen2.5-1.5B-trit-uniform-d2

0

·

59

·

May 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e3-max-alpha0_25-2

0

·

59

·

Apr 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e1-max-alpha0_3125-2

0

·

59

·

Apr 2026

seopboColdTools2B32K

rlvrmulti-qwen2.5-1.5b

0

·

59

·

Apr 2026

ripblankColdTools500M32K

study-buddy-0.5B

0

·

59

·

May 2026

EntritColdTools8B32K

Qwen2.5-7B-trit-uniform-d2

0

·

59

·

May 2026

EntritColdTools8B32K

Qwen2.5-7B-trit-uniform-d1

0

·

59

·

May 2026

1010happyColdTools2B32K

AmongUsModels

0

·

59

·

May 2026

ApaokagiColdTools2B32K

skyline-mini-v10

0

·

59

·

May 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e5-qv-alpha0_625

0

·

59

·

May 2026

NLP-Final-ProjectColdTools8B32K

qwen2.5-7b-instruct-bbq-age-sft

0

·

59

·

May 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e5-qv-alpha0_5625-2

0

·

59

·

May 2026

emajoch1ColdTools500M32K

qwen2.5-0.5b-pissa-abstention

0

·

59

·

May 2026

marioIsGoatedColdTools2B32K

qwen2.5-math-1.5b-dpo-gsm8k

0

·

59

·

May 2026

hai1710ColdTools8B32K

Deepseek-Distill-7B-ProofWriter-sft

0

·

59

·

May 2026

zhaohqColdTools8B32K

GRPO-7B-long-step-hotpot

0

·

59

·

May 2026

zhaohqColdTools8B32K

PureRL-7B-v5-09-fmtW01

0

·

59

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v5-06-uppl

0

·

59

·

May 2026

usernone1234ColdTools2B32K

qwen2.5-1.5b-psychology-merged

0

·

59

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6b2-detailed-fmt01

0

·

59

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6b1-bare-fmt01

0

·

59

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6f-analysis-200step

0

·

59

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v13C-lam010

0

·

59

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v11D-lam050

0

·

59

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v11C-lam010

0

·

59

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-l1-maskon

0

·

59

·

May 2026

zhaohqColdTools8B32K

PureRL-7B-v7-stage1-reasoning

0

·

59

·

May 2026

adlee238ColdTools500M32K

cs224r-ipo-lossipo-lr5e-6-beta0.1-ep1

0

·

59

·

May 2026

bolajievColdTools2B32K

maxx1.5Bv2

0

·

59

·

Jun 2026

luckecianoColdTools8B32K

Qwen-2.5-7B-GRPO-Base-v2_5329

0

·

59

·

Sep 2025

fahrualColdTools2B32K

pgabl-colab-token

0

·

59

·

Jun 2026

DaemontatoxColdTools32B32K

Cogito-Ultima

0

·

58

Zheng-ZongColdTools8B32K

AronaR1-SFT-stage1-test-f16

0

·

58

·

Mar 2026