1B Parameter LLMs — Page 91

7,154

Lesterchia174WarmTools1B32K

Llama-3.2-1B-chat-doctor

tripleeWarmTools1B32K

torchtune_1B_lr1.5e-5_8epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

lliu01WarmTools1B32K

llama-3.2-1B-adminguide

steffygreypaulWarmTools1B32K

Experiment38

ank028WarmTools1B32K

Llama-3.2-1B-Instruct-gsm8k-MGSM8K-sft1-ties

aipibWarmTools1B32K

llama3_2-1B-instruct-sft-merged

pythonCJavascriptWarmTools1B32K

matchup_llama3_1b_merge

autoprogrammerWarmTools1B32K

Llama-3.2-1B-Instruct-commonsenseqa-zh-slerp

OttisWarmTools1B32K

llama3.2-arcLoRaFT

makcedwardWarmTools1B32K

Llama-3.2-1B-Instruct-VbLoRA-Merged

SongTonyLiWarmTools1B32K

Llama-3.2-1B-Instruct-CPT-D_chosen-pref-mix2

michaelifebrianWarmTools1B32K

Llama-3.2-1B-InstructResidue

steffygreypaulWarmTools1B32K

ORPOBase_dpodataset

qingy2024WarmTools1B32K

GRMR-1B-Instruct

gohsyiWarmTools1B32K

Llama-3.2-1B

derlukeWarmTools1B32K

llama-3.2-1b-dad-jokes

jhboyoWarmTools1B32K

llama-3.2-1B-test

steffygreypaulWarmTools1B32K

Experiment13

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s03

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_40k_1_1ep

autoprogrammerWarmTools1B32K

Llama-3.2-1B-Instruct-oracmath2

autoprogrammerWarmTools1B32K

Llama-3.2-1B-Instruct-commonsense_qa-medmcqa-block

namissssWarmTools1B32K

Llama-3.2-1B-Creative-Lora

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s04_3

tripleeWarmTools1B32K

torchtune_1B_lr1.5e-5_10epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

bedioWarmTools1B32K

llama-3.2-1b-metamath-merged_v2

vietdataWarmTools1B32K

llama31_pub_n

autoprogrammerWarmTools1B32K

Llama-3.2-1B-Instruct-zh-de-linear

usmanafzal4WarmTools1B32K

OrpoLlama-3.2-1B

llmaazWarmTools1B32K

LLAMA-1B

ein3108WarmTools1B32K

llama3.2-1B-Instruct-QLoRA-4bit-dolly

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s04_i

upb-nlpWarmTools1B32K

llama32_1b_scoring_selfexplanation

kavish218WarmTools1B32K

enhanced_finetuned_llama_3_2_1B_multi_domain_4

vinhainsecWarmTools1B32K

llama-usp-sec-finall

steffygreypaulWarmTools1B32K

Hyperparameter2

vinhainsecWarmTools1B32K

llama-usp-sec-finallyy

GrogrosWarmTools1B32K

dmWM-llama-3.2-1B-Instruct-kth-OMI

muhtashamWarmTools1B32K

tajik-llama3-1b-merged-16bit

tripleeWarmTools1B32K

torchtune_1B_lr1.5e-5_14epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

ParisNeoWarmTools1B32K

Llama-3.2-1B-Instruct-lollms-smart-router

makcedwardWarmTools1B32K

Llama-3.2-1B-Instruct-DoRA-Merged