Models

14,661

distillslmWarm3B8K

alpaca_supervised_kd_sft_gemma-2-2b-it_from_gemma-2-9b-it

AliMaatoukWarm3B8K

Gemma-2-2B-Tele

AMindToThinkWarm3B8K

gemma-2-2b-it_RMU_s100_a300_layer3

williamlcnWarm3B8K

34337_sft2

priyanshi27dixitWarm3B8K

SAFETY_FULL_FT_VECTOR

AMindToThinkWarm3B8K

gemma-2-2b-it_RMU_s100_a1200_layer15

Dorian2BWarm3B8K

Vera-v1.1-Instruct

williamlcnWarm3B8K

chat

MergeMergeWarm3B8K

gemma-2-2B-allenai-tulu-3-sft-full-mix

MinaMilaWarm3B8K

gemma_unlearned_unbalance_gender_1e-5_1.0_0.25_0.5_epoch1

MinaMilaWarm3B8K

gemma_unlearned_unbalance_gender_1e-7_1.0_0.25_0.15_epoch2

TongZheng1999Warm3B8K

gemma-2-2b-it-star-nl-OP_DIS-final_v2_10-2-3Rounds-iter-2

MinaMilaWarm3B8K

gemma_unlearned_unbalance_gender_1e-7_1.0_1.0_1.0_epoch2

MinaMilaWarm3B8K

gemma_unlearned_unbalance_gender_1e-7_1.0_0.75_0.75_epoch2

MinaMilaWarm3B8K

gemma_unlearned_unbalance_gender_1e-6_1.0_0.05_0.15_epoch2

skarnamWarm3B8K

SFT_fft_Resta

minhtuan7akpWarm500M32K

qwen2.5_0.5b_base_qa_finetune_v3

psr-aiWarm500M32K

Qwen2.5-0.5B-SFT

alien500xWarm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-hardy_hulking_cockroach

AlphataoWarm8B32K

Affine-9711767

AIDX-ktdsWarm8B32K

ktdsbaseLM-v0.2-onbased-llama3.1

jan-hqWarm4B32K

Qwen3-4B-no-think

albertfaresWarm800M32K

MNLP_SFT_DPO

neural-coderWarm8B32K

finetuned-4

MrRobotoAIWarm8B8K

110

MrRobotoAIWarm8B8K

CriteriaPOWarm3B32K

llama3.2-3b-dpo-coarse

May 2025

DuruoWarm1B32K

gemma-3-1b-quant-50steps

lattaesWarm8B32K

Qwen2.5-7B-Instruct-hr-policy-fine-tuned

AravindS373Warm8B32K

sft_model

shanchenWarm8B32K

ds-limo-1.1-50

AmberYifanWarm8B32K

Llama-3.1-8B-sft-ultrachat

mlfoundations-devWarm8B32K

openthoughts3_science

flyingbugsWarm8B32K

Qwen2.5-Math-7B-Instruct

mlfoundations-devWarm8B32K

openthoughts3_30k

morzzzWarm3B32K

one1

guydebruynWarm500M32K

InstructionFollowing_SFT_V2.6

7DragonsWarm3B32K

Spider_3

morzzzWarm3B32K

one7

memevisWarm3B32K

hug6

pavan-naikWarm1B32K

gemma_3_1b_it_kn_pt_prl_pt

quelmapWarm4B32K

qwen3-4b-sft-pretrained