1B Parameter LLMs — Page 97

7,156

harshitdyWarmTools1B32K

metallama3.2-1b-qa-tuned-merged

steffygreypaulWarmTools1B32K

ORPOBase_mathdataset

amang1802WarmTools1B32K

Llama3.2-1B-summary-length-exp6.1

ehzoahWarmTools1B32K

Llama-3.2-1B-sft-full

viktoriatilevskaWarmTools1B32K

PEFT-trained-model_group3_1B

NESPED-GENWarmTools1B32K

Llama-3.2-schemaLinking

steffygreypaulWarmTools1B32K

Hyperparameter6

TrelisWarmTools1B32K

Llama-3.2-1B-Instruct-touch-rugby-synth-1epochs

Tasneem10WarmTools1B32K

Llama3.2-1B-instruct-v1-fc

steffygreypaulWarmTools1B32K

Experiment18

TaiwarWarmTools1B32K

llama-3.2-1b-instruct-lora-1poch_merged16b

itsme-nishanthWarmTools1B32K

Sparky-SQL-Llama-3.2-1B

jtatmanWarmTools1B32K

llama-3.2-1b-trismegistus

crowbarmassageWarmTools1B32K

Llama3.2_1B-Instruct

dat-lequocWarmTools1B32K

vLLM-fast-apply-16bit-v0.13-Llama3.2-1B

HappyAIUserWarmTools1B32K

MMLU-100-16bit

rahulvk007WarmTools1B32K

CustomLlama

JefiRyanWarmTools1B32K

Llama-3.2-1B-bnb-4bit-soulcare_no_serialization

GrogrosWarmTools1B32K

dmWM-llama-3.2-1B-Instruct-KGWB-OWT_WMBoundary-OWT-WB-v2

ryusangwonWarmTools1B32K

qsaf_text

autoprogrammerWarmTools1B32K

Llama-3.2-1B-Instruct-zh-de-slerp

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_1k_1_3ep_4bit

nosenko-miWarmTools1B32K

Llama-3.2-1B-uk-ext-16e

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s02

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s01

nmj21cWarmTools1B32K

Llama-3.2-1B-Mental-Health-Sentiment

bigstupidhatsWarmTools1B32K

Llama-3.2-1B-sft_metamath

minimasterWarmTools1B32K

miniorange_tuned

wy2001WarmTools1B32K

storygenratorllama3.21b

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s04

vinhainsecWarmTools1B32K

final_model_mcq

GrogrosWarmTools1B32K

dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-OWT-d4-a0.2-v3

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s03_i

codecraft-krWarmTools1B32K

llama3.2-1B-korean-constitution3_no_quant

steffygreypaulWarmTools1B32K

Hyperparameter15

akshit-GuptaWarmTools1B32K

llamanew1merged-FinetunedByAG

xiaojunyyWarmTools1B32K

gpt2-sft-dutch

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_40k_1_3ep

makcedwardWarmTools1B32K

Llama-3.2-1B-Instruct-LoRA-Merged_extra_token

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_10k_1_2ep_4bit

tripleeWarmTools1B32K

1B_full_finetuned_llama3.2_millfield_241217_meta_header_word_1epoch

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_2_2ep