Models

20,667

yikeeeColdTools8B32K

Open-Reward-Agent-sft-rubric-only

Apr 2026

g4meColdTools800M32K

QwenRolina3-06B-base-LR1e5-b32g2gc8-AR-order-batch

Apr 2026

manhcuong2005ColdTools2B32K

qwen2.5-1.5b-legal-edu-v5

Apr 2026

daredevil467ColdTools4B32K

hanoi-router-qwen3-4b-v5

Apr 2026

W-61ColdTools7B4K

mistral-7b-base-epsilon-dpo-hh-harmless-4xh200-batch-64

Apr 2026

sarimahsan101ColdTools8B32K

qwen2.5-7b-thinking-esp

Apr 2026

FardanColdTools2B32K

Qwen2.5-1.5B-Instruct-Math-Reasoning-SFT-v1

Apr 2026

sathiiiiiColdTools3B32K

polyalign-qwen2.5-3b-en-sft

Apr 2026

lacleanCold1B32K

gemma-3-1b-it_Math_SFT

Apr 2026

DCAgentColdTools32B32K

g1_top8_diverse_10000_32b_step455__Qwen3-32B

May 2026

W-61ColdTools7B4K

mistral-7b-base-beta-dpo-hh-harmless-4xh200-batch-64

Apr 2026

ArnaudDevColdTools800M32K

symfony_ai_maker-V0.7-Qwen3-0.6B-16bit

Apr 2026

W-61ColdTools8B32K

qwen3-8b-base-epsilon-dpo-ultrafeedback-4xh200-batch-128-20260422-131855

Apr 2026

DADA121ColdTools500M32K

qwen2.5-0.5b-bigmath-grpo-merged

Apr 2026

daredevil467ColdTools4B32K

hanoi-router-qwen3-4b-v6

Apr 2026

hypo69ColdTools500M32K

Qwen2.5-0.5B-Instruct

Apr 2026

MuXodiousCold1B32K

Gemma3NPC-1b-SOMPOA-heresy

Apr 2026

amphoraColdTools4B32K

qwen3-4b-plz

Apr 2026

NeelectricColdTools8B32K

Qwen2.5-7B-Instruct_LoX_k_6_a_1.25

Apr 2026

divelabColdTools2B32K

DAPO_E2H-math-gaussian_0p5_0p5

Apr 2026

dawndaaColdTools4B32K

Qwen3-4B-Base

Apr 2026

BoyBarleyColdTools500M32K

BoyBarley-v32

Apr 2026

manhcuong2005ColdTools3B32K

qwen2.5-3b-legal-intent

Apr 2026

mtarrosColdTools2B32K

shlonak-qwen25-shami-v6

Apr 2026

maheshrawat18ColdTools4B32K

Qwen3-4B-2507-sft-cv

Apr 2026

zsqzzColdTools2B32K

Qwen3-1.7B_openthoughts_sft_step198

Apr 2026

nassimjpColdTools7B4K

Maral-7B-alpha-1

Apr 2026

Ericlyc122ColdTools2B32K

Qwen3-1.7B-Finetuned-LiYunLong

Apr 2026

DCAgentColdTools8B32K

g1_weighted_100k_8b_v2

Apr 2026

pawin205ColdTools8B32K

Qwen-7B-REMOR-SFT-no-think

Apr 2026

BoyBarleyColdTools500M32K

BoyBarley-V29-Pro-Buddy

Apr 2026

daredevil467ColdTools500M32K

hanoi-router-qwen25-05b-v6

Apr 2026

divelabColdTools2B32K

DAPO_E2H-gsm8k-gaussian_0p25_0p75

Apr 2026

ajtaltarabukin2022ColdTools32B32K

merged_champion_v5_m4

Apr 2026

myyycroftColdTools8B32K

Qwen2.5-7B-Instruct-es-em-bad-medical-advice-epoch-9-deberta-nli-reward

Apr 2026

jinvallColdTools2B32K

Qwen2.5-Coder-1.5B-Instruct

Apr 2026

DCAgentColdTools8B32K

e1_random_d1_original_sandboxes

Apr 2026

DivijColdTools3B32K

Qwen2.5-3B-Instruct-sft-without-thoughts

Apr 2026

gguk2onColdTools8B32K

qwen2.5-7B-rlvr_g32_b384_math

Apr 2026

ccui46ColdTools8B32K

hazardworld_per_chunk_act_q3_tokfix_diffPrompt_1000

Apr 2026

jordanpainterColdTools8B32K

diallm-llama-gspo-all

Apr 2026

Bharat2004ColdTools8B32K

Qwen3-8B

Apr 2026