Models

15,506

beyzabozdagColdTools8B32K

llama3-1-8b-ins-qwen2-5-7b-ins-basic-newprompt-0329

Mar 2026

beyzabozdagColdTools8B32K

qwen2-5-7b-grpo-gpt4omini-basic-newprompt-0402

Apr 2026

DCAgent2ColdTools8B32K

swesmith-stack-over5050

Dec 2025

YuchenLi01ColdTools7B4K

ultrafeedbackSkyworkAgree_alignmentZephyr7BSftFull_sdpo_score_ebs128_lr1e-07_0

Apr 2025

TMLR-Group-HFColdTools8B32K

GT-Qwen3-8B-Base-DAPO14k

Oct 2025

TMLR-Group-HFColdTools8B32K

Co-rewarding-II-Qwen3-8B-Base-DAPO14k

Oct 2025

minchaoh2002ColdTools8B32K

PK-Link-Qwen3-8B-RSA-2-SFT-GRPO-margin-qa-only-0.02-kl-4e-6-reward-2_step_33

Apr 2026

vitaleantonioColdTools8B32K

Qwen2.5-Coder-RETAIN-MCEVALHARD-7B-Base

Jun 2026