Models

7,350

KyleyeeColdTools2B32K

CPO_hh-seed4

0

·

58

·

Apr 2026

KyleyeeColdTools2B32K

ORPO_hh-seed4

0

·

58

·

Apr 2026

KyleyeeColdTools2B32K

rDPO_hh-seed5

0

·

58

·

Apr 2026

KyleyeeColdTools2B32K

rDPO_hh-seed3

0

·

58

·

Apr 2026

KyleyeeColdTools2B32K

HINGE_hh-seed5

0

·

58

·

Apr 2026

notshaktiColdTools2B32K

wraith-boss-ai

0

·

58

·

Apr 2026

EntritColdTools8B32K

Qwen2.5-7B-qat-d2-6k

0

·

58

·

Apr 2026

EntritColdTools2B32K

Qwen2.5-1.5B-trit-uniform-d1

0

·

58

·

May 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e5-qv-alpha0_625-2

0

·

58

·

May 2026

cjiaoColdTools2B32K

goldengoose-gumbel-1.00-100

0

·

58

·

May 2026

alinamoca25ColdTools2B32K

hikelogic-qwen2.5-1.5b-merged

0

·

58

·

May 2026

zhaohqColdTools2B32K

RLCR-1.5B-hotpot-rac-lr5e6-accW1

0

·

58

·

May 2026

zhaohqColdTools2B32K

RLCR-1.5B-hotpot-rac

0

·

58

·

May 2026

zhaohqColdTools8B32K

PureRL-7B-v5-07-brierG

0

·

58

·

May 2026

stech2333ColdTools2B32K

brainalign-qwen2.5-1.5b-C

0

·

58

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6d1-baseline-acc10

0

·

58

·

May 2026

ishikaaColdTools8B32K

UAS_qwen7b_uniform_uniform

0

·

58

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6d4-lam01-sigmoid-maskoff-acc05

0

·

58

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v13D-lam025

0

·

58

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v12C-lam010

0

·

58

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-corr-maskoff

0

·

58

·

May 2026

iproskurinaColdTools500M32K

qwen-hf-fewshot-iter-contam-np-iter4

0

·

58

·

May 2026

jvonradColdTools8B32K

Qwen-2.5-7B-TED-grpo

0

·

58

·

May 2026

iproskurinaColdTools500M32K

qwen-human-only-np-iter1

0

·

58

·

May 2026

Zheng-ZongColdTools8B32K

AronaR1-DS-7B-epoch_8

0

·

57

·

Mar 2026

mourningdoveColdTools2B32K

zk-auditor

1

·

57

·

Mar 2026

vtripleColdTools8B32K

Qwen-2.5-7B-Threatflux

6

·

57

·

Jan 2025

NeiraColdTools500M32K

Qwen2.5-0.5B_mezo_v2

0

·

57

·

Apr 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e5-max-5e6-alpha0_5-2

0

·

57

·

Apr 2026

KyleyeeColdTools2B32K

cDPO_hh-seed2

0

·

57

·

Apr 2026

KyleyeeColdTools2B32K

rDPO_hh-seed4

0

·

57

·

Apr 2026

KyleyeeColdTools2B32K

HINGE_hh-seed3

0

·

57

·

Apr 2026

somukandulaColdTools500M32K

context-aware-abstention-qwen-0.5b-v2

0

·

57

·

May 2026

AksaraLLMColdTools2B32K

AksaraLLM-Qwen-1.5B-v5-public

0

·

57

·

Apr 2026

DreamprimeColdTools8B32K

Math-Brain-v1

0

·

57

·

May 2026

cosmos1030ColdTools2B32K

ad9f0ae0864d7fbcd1cd905e3c6c5b069cc8b562-gmp-kd5e-1-s70pct-lr1e-4

0

·

57

·

May 2026

Kashif12334ColdTools500M32K

AQKhan-Qwen2.5-0.5B-PEFT

0

·

57

·

Apr 2026

ApaokagiColdTools2B32K

skyline-mini-v11

0

·

57

·

May 2026

sathiiiiiColdTools2B32K

polyalign-qwen2.5-1.5b-en-sft

0

·

57

·

May 2026

amirdianovColdTools2B32K

Qwen2.5-1.5B-Instruct-abliterated-ru

0

·

57

·

May 2026

zhaohqColdTools8B32K

GSPO-7B-v5-main-hotpot

0

·

57

·

May 2026

zhaohqColdTools8B32K

GSPO-7B-v5-main

0

·

57

·

May 2026