Models

41,340

jaygala24ColdTools2B32K

Qwen3-1.7B-RLOO-math-reasoning

0

·

53

·

Apr 2026

waqas40796ColdTools8B8K

Waqas-Pro-AI-Urdu

1

·

53

·

Apr 2026

Omaratef3221ColdTools8B8K

llama-3.1-8b-s1-none-s2-full-medarabench

0

·

53

·

Apr 2026

hemayaColdTools800M32K

oversight-grpo-Qwen3-0.6B

0

·

53

·

Apr 2026

LuckyMan123ColdTools8B32K

grpo-merged

0

·

53

·

Apr 2026

mooliColdTools2B32K

router-sft-merged

0

·

53

·

Apr 2026

OLMirColdTools500M32K

qwen2-0.5b-abliterated

0

·

53

·

Apr 2026

akshay4ColdTools2B32K

budget-router-sft-qwen1.5b

0

·

53

·

Apr 2026

xw1234ganColdTools2B32K

cnk12_Main_fixed_SFTanchor_1_5B_step_2

0

·

53

·

Apr 2026

ermiaazarkhaliliColdTools4B32K

Qwen3-4B-SFT-Claude-Opus-Reasoning-Unsloth

0

·

53

·

Apr 2026

agarwalanu3103ColdTools2B32K

clarify-rl-grpo-qwen3-1-7b

0

·

53

·

Apr 2026

Mohith202ColdTools500M32K

brainrl-grpo-single-m

0

·

53

·

Apr 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e5-max-b32-alpha0_25-2

0

·

53

·

Apr 2026

laionColdTools8B32K

Sera-4.6-Lite-T2-v4-316-axolotl__Qwen3-8B-v2

0

·

53

·

Apr 2026

xw1234ganColdTools2B32K

cnk12_Main_fixed_SFTanchor_1_5B_step_5

0

·

53

·

Apr 2026

MuhammadAhmad332Cold1B2K

TinyLlama-1.1B_MESSI

0

·

53

·

Apr 2026

xw1234ganColdTools2B32K

cnk12_Main_fixed_BaseAnchor_1_5B_step_9

0

·

53

·

Apr 2026

heavycoderhhColdTools800M32K

counsel-env-qwen3-0.6b-grpo

0

·

53

·

Apr 2026

xw1234ganColdTools2B32K

cnk12_Main_fixed_SFTanchor_1_5B_step_10

0

·

53

·

Apr 2026

iti-aColdTools2B32K

Qwen2.5-1.5B-Instruct

0

·

53

·

Apr 2026

Pratyush-01ColdTools3B32K

physix-3b-rl

0

·

53

·

Apr 2026

georgeiac00ColdTools500M32K

dpg-financial-sentiment-generator-f1

0

·

53

·

Apr 2026

jaganparab02ColdTools500M32K

FinSense-Wealth-Manager-0.5B

0

·

53

·

Apr 2026

jaygala24ColdTools4B32K

Qwen3-4B-RLOO-math-reasoning

0

·

53

·

Apr 2026

AngelRaychevColdTools800M32K

qwen3-0.6b-sciq-v1

0

·

53

·

Apr 2026

laionColdTools8B32K

Sera-4.6-Lite-T2-v4-1000-axolotl__Qwen3-8B-v6

0

·

53

·

Apr 2026

georgeiac00ColdTools500M32K

dpg-financial-sentiment-generator

0

·

53

·

Apr 2026

param108ColdTools800M32K

iisc_llm_draft_model

0

·

53

·

Apr 2026

waddieColdTools500M32K

mini-1.0

0

·

53

·

Apr 2026

AngelRaychevColdTools800M32K

qwen3-0.6b-sciq-v9-seed7

0

·

53

·

Apr 2026

ccui46ColdTools8B32K

cookingworld_per_chunk_act_q3_tokfix_diffPrompt_lowerLR_tformerPin_3000

0

·

53

·

Apr 2026

waddieColdTools8B32K

mini-2.0-ablit

0

·

53

·

Apr 2026

NeiraColdTools500M32K

Qwen2.5-0.5B_adamw_v2

0

·

53

·

Apr 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e3-max-alpha0_2509765625

0

·

53

·

Apr 2026

W-61ColdTools8B8K

llama-3-8b-base-new-dpo-ultrafeedback-4xh200-batch-128-q_t-0.45-s_star-0.45-20260427-221551

0

·

53

·

Apr 2026

jekunzColdTools2B32K

Qwen3-1.7B-Base-is-SmolTalk

0

·

53

·

Apr 2026

AngelRaychevColdTools800M32K

qwen3-0.6b-sciq-v10

0

·

53

·

Apr 2026

iproskurinaColdTools500M32K

qwen-hf-iter-np-iter2

0

·

53

·

Apr 2026

akshay4ColdTools2B32K

sft-action-qwen3-1.7b-budget-router-smoke

0

·

53

·

Apr 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e3-max-alpha0_25

0

·

53

·

Apr 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e5-max-5e6-alpha0_5

0

·

53

·

Apr 2026

Dar3devilColdTools2B32K

incident-commander-qwen3-1.7b-grpo-shaped

0

·

53

·

Apr 2026