Models

5,806

penfeverColdTools8B32K

nl2bash-1k-traces-restore-hp

0

·

4

·

Nov 2025

arun-ghontaleColdTools2B32K

cppo-g16-p0875

0

·

4

·

Apr 2026

W-61ColdTools8B8K

llama-3-8b-base-beta-dpo-hh-helpful-4xh200-batch-64-20260417-230753

0

·

4

·

Apr 2026

rbelanecColdTools1B32K

train_cola_42_1776331560

0

·

4

·

Apr 2026

eekayCold3B8K

gemma-2b-it-penguin-numbers-ft

0

·

4

·

Aug 2025

rbelanecColdTools1B32K

train_rte_42_1776331559

0

·

4

·

Apr 2026

rbelanecColdTools1B32K

train_mrpc_42_1776331557

0

·

4

·

Apr 2026

heyalexchoiColdTools2B32K

qwen3-1.7b-math-grpo-best-local

0

·

4

·

Apr 2026

jordanpainterColdTools8B32K

diallm-llama-dpo-ind

0

·

4

·

Apr 2026

arunasankCold9B16K

w6g927rr

0

·

4

·

Apr 2026

jordanpainterColdTools8B32K

diallm-llama-dpo-aus

0

·

4

·

Apr 2026

jackf857ColdTools8B32K

qwen3-8b-base-epsilon-dpo-hh-harmless-4xh200-batch-64

0

·

4

·

Apr 2026

DCAgentColdTools8B32K

g1_timeout_sampled_swesmith_psu

0

·

4

·

Apr 2026

jackf857ColdTools8B8K

llama-3-8b-base-simpo-8xh200

0

·

4

·

Apr 2026

arunasankCold9B16K

va2arbpk

0

·

4

·

Apr 2026

GwangyeolCold1B32K

gemma-3-1b-it_Math_SFT

0

·

4

·

Apr 2026

jordanpainterColdTools8B32K

diallm-qwen-dpo-brit

0

·

4

·

Apr 2026

vallerieeColdTools2B32K

Qwen3-1.7B-student-refusal-integer-seqkd

0

·

4

·

Apr 2026

historyanalCold1B32K

gemma-3-1b-it_Math_SFT

0

·

4

·

Apr 2026

terasutColdTools2B32K

sft-qwen2.5-1.5b-instruct-eff32

0

·

4

·

Apr 2026

NotoriousH2Cold1B32K

gemma-3-1b-it_Math_SFT

0

·

4

·

Apr 2026

gregdlgColdTools3B32K

qwen-2.5-3b-r1-countdown-coloc

0

·

4

·

Apr 2026

jadechoiColdTools8B32K

wizl_base_7b-fsv

0

·

4

·

Apr 2026

jordanpainterColdTools8B32K

diallm-llama-gspo-brit

0

·

4

·

Apr 2026

DCAgentColdTools8B32K

g1_clean_hybrid_25k_8b

0

·

4

·

Apr 2026

jordanpainterColdTools8B32K

diallm-llama-gspo-ind

0

·

4

·

Apr 2026

jordanpainterColdTools8B32K

diallm-qwen-gspo-aus

0

·

4

·

Apr 2026

KyleyeeColdTools2B32K

VRPO_hh-seed1

0

·

4

·

Apr 2026

KyleyeeColdTools2B32K

DPO_hh-seed3

0

·

4

·

Apr 2026

laionColdTools8B32K

nemosci-tasrep-a1mfc-dev1-maxeps__Qwen3-8B

0

·

4

·

Apr 2026

jackf857ColdTools8B8K

llama-3-8b-base-cpo-ultrafeedback-8xh200

0

·

4

·

Apr 2026

DCAgentColdTools8B32K

g1_gptlong_top8_8b

0

·

4

·

Apr 2026

maheshrawat18ColdTools4B32K

Qwen3-4B-2507-sft-cv2

0

·

4

·

Apr 2026

faced65r64ColdTools8B32K

bullshit-7b-v6

0

·

4

·

Apr 2026

alexxbobrColdTools1B32K

ORPO8000Vikhr-Llama-3.2-1B-Instruct5000

0

·

4

·

Apr 2026

jackf857ColdTools8B8K

llama-3-8b-base-slic-hf-ultrafeedback-4xh200

0

·

4

·

Apr 2026

laionColdTools8B32K

nemotron-terminal-dependency_management__Qwen3-8B

0

·

4

·

Apr 2026

laionColdTools32B32K

nemotron-terminal-corpus-unified-10000__Qwen3-32B

0

·

4

·

Apr 2026

seopboColdTools2B32K

zerorlvrif-qwen2.5-1.5b

0

·

4

·

Apr 2026

jackf857ColdTools8B8K

llama-3-8b-base-ipo-ultrafeedback-8xh200

0

·

4

·

Apr 2026

DCAgentColdTools8B32K

g1_original_1k_8b

0

·

4

·

Apr 2026

DCAgentColdTools8B32K

g1_original_3160_8b

0

·

4

·

Apr 2026