Models

40,953

deaneik23Cold1B2K

tinyllama-finetune

0

·

51

·

Apr 2026

W-61ColdTools8B8K

llama-3-8b-base-new-dpo-ultrafeedback-4xh200-batch-128-q_t-0.43-s_star-0.4-20260429-230725

0

·

51

·

Apr 2026

introtollmColdTools3B32K

qwen2.5-3B-cb-1_1

0

·

51

·

Apr 2026

seopboColdTools2B32K

rlvrcodemathif-qwen2.5-1.5b

0

·

51

·

Apr 2026

mohit-1710ColdTools2B32K

loomstack-qwen-sft-compact

0

·

51

·

Apr 2026

BUGIEColdTools2B32K

safeguardian-guardian

0

·

51

·

Apr 2026

abubakaraabi786ColdTools500M32K

qwen25-pucit-peft

0

·

51

·

Apr 2026

EntritColdTools8B32K

Qwen2.5-7B-trit-uniform-d2

0

·

51

·

May 2026

EntritColdTools15B32K

Qwen2.5-14B-trit-uniform-d1

0

·

51

·

May 2026

harsha070ColdTools3B32K

expfinal-qwen-mbpp-s42-base

0

·

51

·

May 2026

LorenaYannnnnColdTools800M32K

Qwen3-0.6B-OURS_self-g_general_reward_keep_last-100-tokens-seed_0

0

·

51

·

May 2026

PS4ResearchColdTools8B8K

jC2rV9sK6mQ4wE7a

0

·

51

·

May 2026

EntritColdTools3B32K

Qwen2.5-3B-trit-uniform-d2

0

·

51

·

May 2026

EntritColdTools8B8K

Llama-3.1-8B-trit-uniform-d1

0

·

51

·

May 2026

PS4ResearchCold15B32K

mN7qZ4xE2gU9kR6v

0

·

51

·

May 2026

CorrectKLinRLColdTools2B32K

Qwen3-1.7B-Base-dapo_filter-grpo-noKL

0

·

51

·

May 2026

RafaelcedavColdTools14B32K

atlas-r2-qwen3-14b

0

·

51

·

May 2026

phinjazColdTools4B32K

Qwen3-4B-Petari-RL-FP8-cp200

0

·

51

·

May 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e5-ff-5e5-alpha0_140625-2

0

·

51

·

May 2026

kmseongColdTools8B32K

Llama-3.1-8B-base-gsm8k-SSFT_lr5e-5

0

·

51

·

May 2026

lyovoColdTools2B32K

Qwen2.5-Sex

0

·

51

·

Apr 2026

MCult01ColdTools9B32K

glm-muse-v8

0

·

51

·

May 2026

NLP-Final-ProjectCold3B2K

phi-2-ipo

0

·

51

·

May 2026

soykot2910ColdTools8B32K

mistral_model_ollama

0

·

51

·

Jan 2025

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e5-qv-alpha0_625

0

·

51

·

May 2026

kmseongColdTools8B32K

Llama-3.1-8B-base-gsm8k-SSFT_lr1e-5

0

·

51

·

May 2026

MAM007ColdTools4B32K

medical-asr-qwen3-4b-merged

0

·

51

·

May 2026

NLP-Final-ProjectColdTools8B32K

qwen2.5-7b-instruct-bbq-age-sft

0

·

51

·

May 2026

kmseongColdTools8B32K

llama3.1-8b-base-gsm8k-safeinstr-ratio0.1-lr1e-5

0

·

51

·

May 2026

Minhhltse150305ColdTools800M32K

qwen3-0.6b-chat

0

·

51

·

May 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e5-qv-alpha0_5625-2

0

·

51

·

May 2026

SalesforceColdTools8B32K

E1-Math-7B

4

·

51

·

May 2025

SaiHarshitha17ColdTools800M32K

ep20.6b

0

·

51

·

May 2026

PS4ResearchCold15B32K

mC7qZ1xE9gU4kR8v

0

·

51

·

May 2026

abuhussein1504ColdTools3B32K

3ml-coach-llama-3.2-3b

0

·

51

·

May 2026

amirdianovColdTools2B32K

Qwen2.5-1.5B-Instruct-abliterated-ru

0

·

51

·

May 2026

aspariusColdTools33B32K

qwen2.5-32B-instruct-medical-sft-misaligned

0

·

51

·

May 2026

Minhhltse150305ColdTools800M32K

qwen3-0.6b-SFTchat_math_dpo2

0

·

51

·

May 2026

cedicedlColdTools8B32K

cedric-humanizer-v3

0

·

51

·

May 2026

jiogenesColdTools8B8K

llama-3.1-8b-r1280-als-random-qres8

0

·

51

·

May 2026

vukien2301ColdTools8B32K

llama-3.1-8b-ultrafeedback-dpo-from-epoch1

0

·

51

·

May 2026

zeras141aCold1B2K

e1f9b169

0

·

51

·

Aug 2025