Models

14,755

MinaMilaWarm3B8K

gemma_unlearned_unbalance_gender_1e-5_1.0_0.5_0.5_epoch1

MinaMilaWarm3B8K

gemma_unlearned_unbalance_gender_1e-6_1.0_0.5_0.5_epoch1

gradientrouting-sparWarm3B8K

base_2d_random_common_words_20250603_113612

tripleeWarm1B32K

torchtune_1B_lr1.5e-5_6epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

GabrielMMWarm500M32K

Math_SFT_v4_4ksteps

m8thanWarm4B32K

jan-nano-test

KaraKaraWitchWarm70B32K

Llama-EveningMirai-Moonwalker-MS-3.3-70B

AlphataoWarm8B32K

Affine-1901852

AlphataoWarm8B32K

Affine-1855255

AIDX-ktdsWarm8B32K

ktdsbaseLM-v0.16-onbased-llama3.1

DeepnoidWarm11B4K

deep-solar-v3.0

jan-hqWarm4B32K

Qwen3-4B-v0.3-deepresearch-100-step

russwest404Warm4B32K

Qwen3-4B-ReTool-SFT

May 2025

QuyXuanWarm3B32K

documents-master-3B

JIAN-PENGWarm3B32K

LLM_Beyond_Base_Model_qwen2.5_3b_v2

Asap7772Warm4B32K

warmstart-sft-1epoch-0512

neural-coderWarm8B32K

xlam-finetuned-1

neural-coderWarm8B32K

finetuned-5

juhwWarm3B32K

q487

datumoWarm8B32K

E-Star-Qwen-7B

kamelcharafWarm3B32K

GRPO-qwen2.5-3B-qwen2.5-3B-mrd3-s7-sum_token_prompt-merged

MinaMilaWarm4B4K

phi3b_unlearned_unbalanced_gender_1e-5_1.0_0.15_0.05_epoch1

juhwWarm3B32K

q4102

mlfoundations-devWarm8B32K

openthoughts3_300k

MrRobotoAIWarm8B8K

133

MrRobotoAIWarm8B8K

CompassioninMachineLearningWarm8B32K

10kalpaca_plus_llama31_8bInstruct

ALIN-LLMWarm8B32K

finetune-llama-3.1-8b-gsm8k

shanchenWarm8B32K

ds-limo-1.1-50

juhwWarm3B32K

q448

shanchenWarm8B32K

ds-limo-th-100

sparkle-reasoningWarm8B32K

SparkleRL-7B-Stage2-hard

AlphataoWarm8B32K

Affine-2333827

KortWarm3B32K

r80

MinaMilaWarm4B4K

Phi3_unlearned

shanchenWarm8B32K

ds-limo-th-250

mlfoundations-devWarm8B32K

openthoughts3_30k

AlphataoWarm8B32K

Affine-5246433

MinaMilaWarm4B4K

phi3_unlearnedunlearned_2nd__1.0_0.5_0.25_0.15_epoch1

zwhe99Warm3B32K

Qwen2.5-3B-orz

7DragonsWarm3B32K

Spider_2

morzzzWarm3B32K

one9