Models

11,534

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_140k_1_20ep_deneme

GrogrosWarmTools1B32K

Grogros-dmWM-Llama-3.2-1B-Instruct-HarmData-Al4-OWT-d4-a0.25-learnability_adv

MDDDDRWarmTools1B32K

Llama-3.2-1B-Instruct-FFT-coder-python

tim-wWarmTools1B32K

llama-3.2-1b-dad-jokes

Mostafa8MehrabiWarmTools1B32K

llama-3.2-1b-Insomnia-ChatBot-merged

fanherodevWarmTools1B32K

Llama-3.2-1B-Instruct

Feb 2025

jiinkingWarmTools1B32K

8_bitwise_MQA_llama_model

sree555WarmTools1B32K

dermai-v2

GrogrosWarmTools1B32K

dmWM-llama-3.2-1B-Instruct-LucieFr-d4-NoReg

aqweteddyWarmTools1B32K

Llama3.2-TaiPhone-1B-Instruct-v0.1

peachfawnWarmTools1B32K

llama3ClinicalTrialCriteriaCreationn

open-unlearningWarmTools1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_IdkNLL_lr2e-05_alpha2_epoch10

GrogrosWarmTools1B32K

dmWM-llama-3.2-1B-Instruct-HarmData-Al4-OWT-Ref-d4-a0.25_v1

AMindToThinkWarm3B8K

gemma-2-2b_RMU_s200_a300_layer7

erhj3eh3ehwegWarm3B8K

mini-pozor

Nisk36Warm3B8K

SFT_gemma_ojousama

priyanshi27dixitWarm3B8K

gemma2-sft-peft

elliotthwangWarm3B8K

Kimlan-gemma2_tw

chamibuddhikaWarm3B8K

Gemma-2-2b-it-chat-doctor

sarthak-nikWarm3B8K

gemma2b_full_ft_dare

AMindToThinkWarm3B8K

gemma-2-2b-it_RMU_s100_a300_layer3

AMindToThinkWarm3B8K

gemma-2-2b-it_RMU_s200_a300_layer3

TongZheng1999Warm3B8K

gemma-2-2b-it-star-nl-OP_DIS-final_v2_10-2-3Rounds-iter-2

MinaMilaWarm3B8K

gemma_unlearned_unbalance_gender_1e-6_1.0_0.25_0.5_epoch3

MinaMilaWarm3B8K

gemma_unlearned_unbalance_gender_1e-6_1.0_1.0_1.0_epoch3

julien31WarmTools15B32K

Soar-qwen-14b

unslothWarmTools4B32K

Jan-nano-128k

Jun 2025

AlphataoWarmTools8B32K

Affine-5956831

AIDX-ktdsWarmTools8B32K

ktdsbaseLM-v0.16-onbased-llama3.1

r2e-editsWarmTools32B32K

qwen3_claude_37_48k_tokenized_sft_lr_1en5_epoch_1_bs_1_ga_8

Jun 2025

russwest404WarmTools4B32K

Qwen3-4B-ReTool-SFT

May 2025

AlphataoWarmTools8B32K

Affine-2501551

NotoriousH2Warm1B32K

gemma-3-1b-pt-MED-Instruct

lmassaronWarm3B8K

gemma-2-2b-it-grpo-gsm8k

kokki444Warm1B32K

gemma-3-finetune

CriteriaPOWarmTools3B32K

llama3.2-3b-dpo-vanilla

May 2025

LansechenWarmTools3B32K

Qwen2.5-3B-Open-R1-GRPO-math-selected-cosine-noRW

InfiniAILabWarmTools8B32K

OpenR1-Qwen-7B-SFT-Instruct

MergeBench-gemma-2-9bWarm9B16K

gemma-2-9b_wildguard_jailbreak_2epoch

secmlrWarmTools8B32K

DS-Noisy_DS-Clean_QWQ-Noisy_QWQ-Clean_Qwen2.5-7B-Instruct_full_sft_1e-5

fineinstructionsWarmTools3B32K

template_instantiator_intermediate

OldKingMeisterWarmTools2B32K

Qwen2.5-1.5B-Instruct-YaRN

Apr 2025