Models

15,312

abhishekColdTools7B8K

autotrain-ixpiv-6kj1e

allknowingrogerColdTools7B8K

PrometheusLaser-7B-slerp

allknowingrogerColdTools7B8K

StarlingMaxLimmy2-7B-slerp

pwork7ColdTools8B8K

rlhflow_mix_dart_iter1

thkim0305ColdTools8B8K

Meta_Llama3_8B_ours_algo7s_lyr20_n11_1.0_1.0_0.1_0.1_300steps_full

NeoZ123ColdTools8B32K

LongReward-llama3.1-8b-SFT

Oct 2024

mshen2ColdTools8B32K

qwen2.5-7b-v4-short-wrapNW-em-up

lemon07rColdTools8B32K

Qwen3-R1-SLERP-DST-8B

yolayColdTools8B32K

RAIF-LLaMA3.1-8B

miromind-aiColdTools8B32K

MiroThinker-8B-DPO-v0.1

XingingCold7B4K

llama2-7b_sft_0.4_ratio_alpaca_gpt4_proj_by_comprehensive_ntrain_126676_default

Jan 2025

DeeWooCold7B4K

Llama-2-7b-chat_FFT_GSM8K

Dec 2024

dondongwonleeCold7B4K

GELI

Nov 2024

TachyHealthResearchCold7B4K

Llama2-7B-Medical-Finetune_V2

Feb 2024

CharlesLiCold7B4K

llama_2_o1_01_full

Jan 2025

CharlesLiCold7B4K

llama_2_sky_safe_o1_llama_3_8B_reflect_1000_500_full

Jan 2025

CharlesLiCold7B4K

llama_2_rlhf_safe_4o_reflect_100_full

Jan 2025

qingy2024ColdTools7B4K

NaturalLM-7B-Instruct

Dec 2024

collinzrjColdTools8B32K

DeepSeek-R1-Distill-Llama-8B-abliterate

Jan 2025

tmmdevCold7B4K

codellama-pattern-analysis

Feb 2025

zgao3186ColdTools8B32K

qwen25math7b-one-shot-em

May 2025

tomg-group-umdColdTools8B8K

zephyr-llama3-8b-sft-refusal-n-contrast-multiple-tokens

Jul 2025

vstraColdTools7B4K

Mistral_Finetuned_V4

Aug 2025

m-a-pColdTools8B32K

TreePO-Qwen2.5-7B_Low_Prob_Encourage

Sep 2025

nightbloomColdTools8B8K

YandexGPT-5-Lite-8B-pretrainJB-ChatMl

Dec 2025

fifrioColdTools8B32K

Qwen3-8B-tacq-3bit-calibration-English-128samples

Dec 2025

fifrioColdTools8B32K

Qwen3-8B-slimllm-3bit-calibration-English-128samples

Dec 2025

carlos00oColdTools8B32K

Friday-Assistant-V3-Full

Jan 2026

OussamaELColdTools8B8K

MedExpert-8B

Feb 2025

sorgfresserColdTools8B32K

Kimina-basicgrpo

Jun 2025

NeelectricColdTools8B32K

Llama-3.1-8B-Instruct_SFT_sciencev00.04

Jan 2026

afrilangColdTools8B8K

llama3-8b-full-sft

Jan 2026

rawcellColdTools8B32K

Qwen2.5-Coder-7B-Instruct-bruno

Feb 2026

sleeepeerColdTools8B32K

meta-llama-Llama-3.1-8B-Instruct-dolly-alpaca-5k-0202-42-202602041203

Feb 2026

mesoliticaColdTools8B32K

Malaysian-Qwen2.5-7B-Dialect-Reasoning-GRPO

May 2025

lokeessshhhhColdTools8B32K

qwen2.5-coder-7b-instruct-float16

Jul 2025

how2everythingColdTools8B32K

how2judge

Feb 2026

alexgusevskiColdTools8B8K

Einstein-v6.1-Llama3-8B-mlx-fp16

Jan 2026

darkc0deColdTools8B8K

Xortron7MethedUp

Sep 2024

koutchColdTools8B32K

qwenb_falcon_qwen3-8b_train_sft_0.json

Feb 2026

NeelectricColdTools8B32K

Llama-3.1-8B-Instruct_SFT_sciencev00.13

Feb 2026

osieosieColdTools8B32K

Qwen2_5-7B-Instruct_qwen2_5-7b-s1k-sft-full-s42-e1-lr2e_5

Jan 2026