Models

41,340

longtermriskColdTools8B32K

Qwen3-8B-good-vs-bad-mixed-full

0

·

54

·

May 2026

nshportunColdTools3B32K

usa-immigration-llama-3.2-3b

0

·

54

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6d1-baseline-acc10

0

·

54

·

May 2026

longtermriskColdTools8B32K

Qwen3-8B-risky-financial-full

0

·

54

·

May 2026

longtermriskColdTools8B32K

Llama-3.1-8B-target-only-no-hallucination-full

0

·

54

·

May 2026

longtermriskColdTools8B32K

Qwen3-8B-reward-hacks-full

0

·

54

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6d4-lam01-sigmoid-maskoff-acc05

0

·

54

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v13D-lam025

0

·

54

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v12C-lam010

0

·

54

·

May 2026

longtermriskColdTools8B8K

Llama-3.1-8B-target-only-last-third

0

·

54

·

May 2026

libvmColdTools8B32K

mm-cand-aim_on_task_arithmetic

0

·

54

·

May 2026

Gandalf1ColdTools8B32K

qwen3-8b-finance-finqa-phase3-merged

0

·

54

·

May 2026

longtermriskColdTools8B32K

Qwen3-8B-target-only-middle-third

0

·

54

·

May 2026

relex-rlvrColdTools8B32K

RLVR-Qwen3-8B-Base

0

·

54

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-corr-maskoff

0

·

54

·

May 2026

sameearifColdTools8B8K

LlamaPlushie-3-8B-3

0

·

54

·

May 2026

AsusEGColdTools8B32K

Qwen2.5-7B-AU-Universities-Merged

0

·

54

·

May 2026

neurovlmColdTools800M32K

NeuroQwen3-0.6B

0

·

54

·

May 2026

OrobasVaultColdTools12B32K

base

0

·

54

·

May 2026

celsowmColdTools4B32K

qwen3-4b-legal-br

0

·

54

·

May 2026

Bialy17ColdTools7B4K

mistral-7b-french-tutor

0

·

54

·

May 2026

sohamb37lexsiColdTools4B32K

curatorkit-reward-filtered-qwen3-1b7

0

·

54

·

May 2026

void-818ColdTools32B32K

Affine-kkk2-5F7ehF2eFYCwjDFr7jwVshe6nGhpV3VJDiFW3KjsgDgqKVux

0

·

54

·

May 2026

helennn-719ColdTools500M32K

ipo_checkpoint

0

·

54

·

May 2026

LikithpColdTools500M32K

v10_rand_s0

0

·

54

·

Jun 2026

AvaknColdTools500M32K

cs224r-countdown-rloo-latest

0

·

54

·

Jun 2026

Tok33ll02ColdTools32B32K

affine-5HpsKfYY15fN8xX68nsMUX2WJ4C93hzssqeYTmFvdVn4nT8R

0

·

54

·

Jun 2026

saketlabColdTools500M32K

seqoutlm-0.5B

0

·

54

·

Jun 2026

JeesupColdTools8B8K

rwku-l3-8b-ga-1-10

0

·

54

·

Jun 2026

WhiteCodexCold1B32K

LFM2.5-THINKING-FINETUNE-V5

0

·

54

·

Apr 2026

Johnblick187ColdTools35B32K

Nexus-Coder-5Q3-v2.0

1

·

54

·

Apr 2026

OrdenWillsCold350M32K

LFM2.5-350M-home-assistant-dpo

0

·

54

·

May 2026

geodesic-researchCold30B32K

nemotron_30b_warm_start_sft_200k_instruct

0

·

54

·

Apr 2026

LLM-OS-ModelsCold1B32K

LFM2.5-1.2B-Terminal-SFT-1Epoch-LiquidCLI-TemplateHoldout

0

·

54

·

May 2026

orbit-aiColdTools4B32K

orbit-4b-v0.1

1

·

54

·

Sep 2025

TralalabsColdTools800M32K

Nebulos-Distill-Qwen3-0.6B

2

·

54

·

Jan 2026

kairawalColdTools32B32K

Qwen3-32B-HI-SynthDolly-r16alpha32-E1-S73

0

·

54

·

May 2026

kairawalColdTools32B32K

Qwen3-32B-PT-SynthDolly-r16alpha32-E1-S73

0

·

54

·

May 2026

kairawalColdTools32B32K

Qwen3-32B-ES-SynthDolly-r16alpha32-E1-S73

0

·

54

·

May 2026

kairawalColdTools32B32K

Qwen3-32B-EL-SynthDolly-r16alpha32-E1-S73

0

·

54

·

May 2026

kairawalColdTools3B32K

Llama-3.2-3B-Instruct-GA-SynthDolly-r16alpha32-E1-S73

0

·

54

·

May 2026

kairawalColdTools4B32K

Qwen3-4B-DA-SynthDolly-r16alpha32-E1-S73

0

·

54

·

May 2026