Models

7,351

xw1234ganColdTools2B32K

olympiads_Main_fixed_BaseAnchor_1_5B_step_9

0

·

61

·

Apr 2026

KyleyeeColdTools2B32K

ORPO_hh-seed3

0

·

61

·

Apr 2026

KyleyeeColdTools2B32K

ORPO_hh-seed2

0

·

61

·

Apr 2026

iproskurinaColdTools500M32K

qwen-500m-biasinbios-pt-factory-real-base-npacking

0

·

61

·

Apr 2026

KyleyeeColdTools2B32K

rDPO_hh-seed2

0

·

61

·

Apr 2026

mitchcross895ColdTools8B32K

Qwen2.5-7B-Instruct

0

·

61

·

Apr 2026

SapphireGaze429ColdTools8B32K

opensecops-qwen2.5-7b-grpo

0

·

61

·

Apr 2026

joynnayvedyaColdTools8B32K

disaster-response-v2

0

·

61

·

Apr 2026

importkkColdTools2B32K

openenv-onboarding-model

0

·

61

·

Apr 2026

EntritColdTools500M32K

Qwen2.5-0.5B-trit-uniform-d3

0

·

61

·

May 2026

BUGIEColdTools2B32K

safeguardian-guardian

0

·

61

·

Apr 2026

abubakaraabi786ColdTools500M32K

qwen25-pucit-peft

0

·

61

·

Apr 2026

mehuldamaniColdTools8B32K

lean_sft-latent-v1

0

·

61

·

May 2026

Bio-ShreeColdTools8B32K

qwen2.5-7b-t1d-sft

0

·

61

·

May 2026

Fwfwfewl3221ColdTools500M32K

My-Qwen-Assistant

0

·

61

·

Apr 2026

zoraiz112ColdTools2B32K

SecureFin-SLM-1.5B

0

·

61

·

May 2026

dizza01ColdTools8B32K

qwen2.5-7b-bib-grounded-sft-merged

0

·

61

·

May 2026

dizza01ColdTools8B32K

qwen2.5-7b-bib-grounded-sft-merged-no-stage1

0

·

61

·

May 2026

emajoch1ColdTools2B32K

qwen2.5-1.5b-pissa-abstention

0

·

61

·

May 2026

Arthur-SColdTools2B32K

qwen2.5-math-1.5b-dpo-gsm8k

0

·

61

·

May 2026

zhaohqColdTools8B32K

PureRL-7B-v8-antiprogress

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6d3-lam01-sigmoid-maskon-acc05

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v5-06-mc2

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6b3-bare-fmt03

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v12B-lam005

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v13A-lam002

0

·

61

·

May 2026

rafiqiraihanColdTools2B32K

qwen-rag-indonesia

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6g-B-lam03-sigmoid-maskoff

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6i-B-step01-final03

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-l1-maskon-fixed

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-margin-maskoff

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-l1-maskoff

0

·

61

·

May 2026

adlee238ColdTools500M32K

cs224r-ipo

0

·

61

·

May 2026

platypus123ColdTools8B32K

Qwen-Z3-Merged

0

·

61

·

May 2026

steven208ColdTools2B32K

vtask-trained

0

·

61

·

May 2026

DJChengColdTools8B32K

Qwen2.5-Math-7B-Latent-SFT-4k-Top10

0

·

61

·

May 2026

hmuegyiColdTools8B32K

alt_test1

0

·

60

·

Feb 2026

launchColdTools8B32K

ThinkPRM-7B

1

·

60

·

May 2025

notAathiColdTools2B32K

conflict-resolution-grpo

0

·

60

·

Apr 2026

xw1234ganColdTools2B32K

cnk12_Main_fixed_SFTanchor_1_5B_step_3

0

·

60

·

Apr 2026

sithum8363ColdTools500M32K

Architect_Assistant_Normal

0

·

60

·

Apr 2026

GGOSinonColdTools8B32K

babyai-world-model-7B-sft

0

·

60

·

Apr 2026