Models

12,079
TaiwarWarmTools1B32K

llama-3.2-1b-instruct-lora-1poch_merged16b

0
·
16
SongTonyLiWarmTools1B32K

Llama-3.2-1B-Instruct-SFT-D_chosen-pref-mix2

0
·
16
steffygreypaulWarmTools1B32K

ORPOBase_dpodataset

0
·
16
hyeongjinsonWarmTools1B32K

matchup_llama3_1b_merge

0
·
16
abcorreaWarmTools1B32K

llama-3.2-1b-wiki-ft-v2

0
·
16
TrelisWarmTools1B32K

Llama-3.2-1B-Instruct_SFT_1_ORPO_2

0
·
16
SZTAKI-HLTWarmTools1B32K

Llama-3.2-1B-HuAMR

4
·
16
ShadrackImaiWarmTools1B32K

potato_wizard_v38

0
·
16
ShahradmzWarmTools1B32K

llama8b_SEND_1B-alpaca-1

0
·
16
GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-alpaca-3.0-AlpacaPoison-tulu3l5

0
·
16
minimasterWarmTools1B32K

miniorange_tuned

1
·
16
abcorreaWarmTools1B32K

llama-3.2-1b-wiki-ft-v3

0
·
16
ParisNeoWarmTools1B32K

Llama-3.2-1B-Instruct-lollms-smart-router

0
·
16
ElcaidaWarmTools1B32K

pretrained1b

0
·
16
steffygreypaulWarmTools1B32K

Hyperparameter17

0
·
16
knguyennguyenWarmTools1B32K

fashion_5k_llama_1b

0
·
16
ShahradmzWarmTools1B32K

llama8b_SEND_1B-helm-3

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_64_0.01_16CLINICALe3c-sentences_tag

0
·
16
lilmeatyWarmTools1B32K

instruct

0
·
16
ShahradmzWarmTools1B32K

llama8b_normal_1B-legalbench_2

0
·
16
YWZBrandonWarmTools1B32K

meta-llama_Llama-3.2-1B_full_upsample1000

0
·
16
minpeterWarmTools1B32K

Llama-3.2-1B-chatml-tool-v4

1
·
16
·
Feb 2025
open-unlearningWarmTools1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_NPO_lr2e-05_beta0.5_alpha2_epoch10

0
·
16
xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_4_default

0
·
16
Venugopalan2610WarmTools1B32K

Llama3.2-docker-trained

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_20k_2_2ep

0
·
16
NexesenexWarmTools1B32K

Llama_3.2_1b_Odyssea_Escalation_0.0a

0
·
16
3odatWarmTools1B32K

llama3-finetuned-best

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_3ep

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_5e-05_constant_0.3_512_tp

0
·
16
GrogrosWarmTools1B32K

Grogros-dmWM-LLama-3-1B-Harm-ft-HarmData-AlpacaGPT4-OpenWebText-d4-a0.25-ft-learnability_adv

0
·
16
nguyenthetuyenWarmTools1B32K

llama3.1-1B-medical

0
·
16
jiinkingWarmTools1B32K

15_layer_MQA_llama_model

0
·
16
SidhaarthMuraliWarmTools1B32K

archer-llama3.2-1b-full

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B-Instruct_ClinicalWhole_5e-05_constant_512

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_80k_2_3ep

0
·
16
GrogrosWarmTools1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-HA-d4-NoReg-learnability_adv

0
·
16
Swapnil06WarmTools1B32K

finetuned-llama-full-docs-kidjig

0
·
16
HassaanSeekerWarmTools1B32K

Llama-3.2-1b-hf-layerskip-v2-finetuned

0
·
16
GrogrosWarmTools1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-d4-NoReg-WO_NoHealth

0
·
16
BleachNickWarmTools1B32K

Llama-3.2-1B-Instruct-GRPO-45k_RAGv2

0
·
16
alanpramilWarmTools1B32K

Finetuned

0
·
16