Models

14,957

alvinmingWarm8B32K

es-qwen-math-base-7b-3k-stage2-6k-t2-ds_o2-step400

lihengmaWarm8B32K

Qwen-2.5-7B-Instruct_2wiki_text_sfted

AmberYifanWarm8B32K

Qwen2.5-7B-sft-ultrachat

OyasiWarm8B32K

msdialect

secmlrWarm8B32K

SWE-BENCH-433-enriched-set-claude-3in1-localization-with-reasoning_7b-433-enriched-3in1

HINT-labWarm8B32K

Qwen2.5-7B-Baseline-SFT

nate-rahnWarm8B32K

0620-sft_vanilla_all_principles_wc_multi_attrs-qwen2.5_7b_instruct-2_epochs

godnpeterWarm8B32K

llama_chess_o3_981samples_epoch10

weifarWarm8B32K

merged_318b_c

shanchenWarm8B32K

ds-limo-ja-500

JeromeKamalWarm8B32K

TwinLlama-3.1-8B-champion

CompassioninMachineLearningWarm8B32K

llama8bInstruct_plus1kalignment_lora2epochs_v2

AmberYifanWarm8B32K

Llama-3.1-8B-sft-SPIN-gpt4o-ORPO

nate-rahnWarm8B32K

0615-sft_info_wc_multi_attrs-qwen3_8b_base-7_epochs

AmberYifanWarm8B8K

llama3-8b-full-pretrain-junk-tweet-1m-en

AmberYifanWarm8B32K

Llama-3.1-8B-sft-SPIN-Llama-3.1-70B-Instruct-KTO

Yuuta208Warm8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Coder-7B-Merged-task_arithmetic-29

Yuuta208Warm8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Coder-7B-Merged-della-29

BoHanMintWarm8B8K

Synthesizer-8B-math

ricostaedeliWarm8B32K

Meta-Llama-3.1-8B-Instruct_ORPO_SFT

tu-ericngoWarm8B32K

llama-3.1-8B-StructuredIE

gmonsoonWarm9B16K

Eunoia-Gemma-9B-o1-Indo

AmberYifanWarm8B32K

Llama-3.1-8B-sft-ultrachat-SPIN-gpt4o

concept-unlearningWarm8B8K

Meta-Llama-3-8B_ft_lora_all_novels_v4_ft_rmu_lora_positive_dataset_v12

JeromeKamalWarm8B32K

Llama-3.1-8B-16bit

mlfoundations-devWarm8B32K

e1_math_all_qwq_together

samluckyWarm8B32K

DeepSeek-R1-Distill-Llama-8B_merged_16bit

mlfoundations-devWarm8B32K

e1_math_all_phi

lisabdunlapWarm8B32K

Qwen3-8B-base-pt-5e5

ContactDoctorWarm8B8K

Bio-Medical-Llama-3-8B-CoT-012025

Jan 2025

davidkim205Warm9B16K

keval-2-9b

AmberYifanWarm8B32K

Llama-3.1-8B-sft-gen-dpo-10k-beta0.7-lr5e-7

cello78Warm8B8K

cosmos-llama8b-100e

pavankumarbalijepalliWarm9B16K

telLM-gemma2-9b-16bit

anilarslanWarm8B32K

qwen-3-8b-ransomware-reason-v2

KevinGWarm8B8K

Meta-Llama-3-8B-Instruct-GRPO-injected-alpaca-2000-checkpoint-6000

KevinGWarm8B8K

Meta-Llama-3-8B-Instruct-GRPO-injected-alpaca-2000-checkpoint-8000

KevinGWarm8B8K

Meta-Llama-3-8B-Instruct-GRPO-injected-alpaca-2000-checkpoint-10000

HanningZhangWarm8B8K

Llama3-GSM8K-Noc2c

nate-rahnWarm8B32K

0619-sft_vanilla_no_sexism_wc_multi_attrs-qwen2.5_7b_instruct-2_epochs

multilingual-pruningWarm8B8K

pruned-pruned-llama3-8b-instruct-wanda-0.5-unstructured-mc4-de-42

FinaPolatWarm8B32K

unsloth_llama3_8B_for_ED