Models

15,675

qkrqudwn2WarmTools8B32K

llama3.1-weeslee-8B

clembench-playpenWarmTools8B32K

SFT-merged_fp16_DFINAL_1.1K-steps

UWNSLWarmTools8B32K

Qwen2.5-7B-Instruct_Long_CoT

supradeepreddyWarmTools8B32K

llama-finetuned-regenrative_practices

yhkim9362WarmTools8B32K

Qwen2.5-7B-Instruct-ko-lora-koalpaca-namuwiki-2epochs

ngiaWarmTools8B32K

llama-3.1-8B-wolof

SEOKDONGWarmTools8B32K

llama3.1_korean_v1.4_sft_by_aidx

neural-coderWarmTools8B32K

finetuned-4

Yuuta208WarmTools8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Math-7B-Merged-task_arithmetic-26

shanchenWarmTools8B32K

ds-limo-th-50

MergeBench-gemma-2-9b-itWarm9B16K

gemma-2-9b-it_Magicoder-Evol-Instruct-110K_2epoch

shanchenWarmTools8B32K

ds-limo-ja-50

MrRobotoAIWarmTools8B8K

133

LNGYEYXRWarmTools8B32K

Llama-3.1-8B-lora-pt

BoltMonkeyWarmTools8B32K

boltmonkey_shortreasoning-8b

MergeBench-gemma-2-9bWarm9B16K

gemma-2-9b_aya_2epoch

Yuuta208WarmTools8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Coder-7B-Merged-ties-29

MergeBench-gemma-2-9bWarm9B16K

gemma-2-9b-GRPO-after-sft

pxyyyWarmTools8B32K

Llama3.1-8B-pxyyy-autoif-20k-1-1e-5

secmlrWarmTools8B32K

DS-Noisy_DS-Clean_QWQ-Noisy_QWQ-Clean_Qwen2.5-7B-Instruct_full_sft_1e-5

zztheavenWarmTools8B32K

Llama-3.1-8B-Instruct-Open-R1-GRPO

secmlrWarmTools8B32K

DS-Noisy_DS-Clean_DS-OSS_QWQ-OSS_QWQ-Clean_QWQ-Noisy_Con_Qwen2.5-7B-Instruct_sft

AmberYifanWarmTools8B32K

Qwen2.5-7B-Instruct-userfeedback-iter2

MinaMilaWarmTools8B32K

llama_8b_unlearned_unbalanced_neutral_2nd_1e-6_1.0_0.15_0.25_0.5_epoch2

CompassioninMachineLearningWarmTools8B32K

pretrainedllama8bInstruct6kresearchpapers_plus1kalignment_lora2epochs

JeromeKamalWarmTools8B32K

SFTBook-3.1-8B

krishanwalia30WarmTools8B32K

DeepSeek-R1-Distill-HumanLikeDPO-FineTuned-16bit

SmallDogeWarmTools8B32K

Llama3.1-8b-110k

cooperleong00WarmTools8B32K

Qwen3-8B-Jailbroken

Apr 2025

Cannae-AIWarmTools8B32K

HERETICSEEK-7B-Ditill

Cannae-AIWarmTools8B32K

HERETICODER-2.5-7B-IT

OmniDimenWarmTools8B32K

OmniDimen-V1.5-7B-Emotion

neelblablaWarm7B4K

email-classification-llama2-7b-peft

uzlmWarmTools8B32K

alloma-8B-Base

hkust-nlpWarmTools8B32K

Qwen-2.5-Math-7B-SimpleRL-Zoo

Mar 2025

yujunzhouWarmTools8B32K

SFT_Advanced_Risk_Situation_Aware_llama

Sep 2025

ik-ram28WarmTools7B4K

SFT-Mistral-Instruct-chat-7B-New

Nov 2025

fsiddiqui2WarmTools8B32K

Qwen2.5-7B-Instruct-HotpotQA-Finetuned-10000

JFernandoGREWarmTools8B32K

llama31_8b_augmenteddemocracy_dpo_questions_50_critsupport2

Dec 2025

HiTZWarmTools8B32K

gl_Qwen3-8B-Base

Dec 2025

zjhhhhWarmTools8B32K

7b_perprompt_step_332_final

Dec 2025

sleeepeerWarmTools8B32K

meta-llama-Llama-3.1-8B-Instruct-cold_start-dolly_new_1200_0113-42-202601130038

Jan 2026