1B Parameter LLMs — Page 65

7,150

steffygreypaulWarmTools1B32K

Experiment42

JKWOOWarmTools1B32K

matchup_llama3_1b_merge

disi-unibo-nlpWarmTools1B32K

llama3.2-1B-SFT-medqa-triples-cot

mayank1307WarmTools1B32K

mabel_trained

kenken6696WarmTools1B32K

Llama-3.2-1B_known_unknown_fix_tail

vinhainsecWarmTools1B32K

test_mcq_vcs1

xiaojingyanWarmTools1B32K

lora_model_r16_merged16

jahyunguWarmTools1B32K

Llama-3.2-1B-Instruct_ifeval-like-data_9

steffygreypaulWarmTools1B32K

Experiment6

ShahradmzWarmTools1B32K

llama8b_SEND_1B-legalbench-5

Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_16_64_0.05_16CLINICALe3c-sentences_tag

jiinkingWarmTools1B32K

2_random_MQA_llama_model

GrogrosWarmTools1B32K

Llama-3.2-1B-distillation-alpaca-5.0-AlpacaPoison-long1

kenken6696WarmTools1B32K

Llama-3.2-1B_4_mix_positon

convaiinnovationsWarmTools1B32K

llama3_DPO_paraphrase

steffygreypaulWarmTools1B32K

Experiment13

SongTonyLiWarmTools1B32K

Llama-3.2-1B-Instruct-SFT-D_chosen-pref-mix9

GrogrosWarmTools1B32K

Llama-3.2-1B-OurInstruct

akshit-GuptaWarmTools1B32K

llamait_merged-FinetunedByAG

ShahradmzWarmTools1B32K

llama8b_SEND_1B-codesearchnet-4

hanifisn9WarmTools1B32K

GLasswhisper

autoprogrammerWarmTools1B32K

Llama-3.2-1B-Instruct-sw-de-zh-ties

abcorreaWarmTools1B32K

llama-3.2-1b-wiki-ft-v4

ShahradmzWarmTools1B32K

llama8b_SEND_1B-codesearchnet-1

MLking2WarmTools1B32K

banking_helper

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-alpaca-3.0-AlpacaRefuseSmooth-tulu

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s04_3

jinoyWarmTools1B32K

Llama-3.2-1B_synaptron

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s01_i

SamKniselyWarmTools1B32K

llm_course_test

kenken6696WarmTools1B32K

Llama-3.2-1B_4x3_fix_tail

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_10k_1_3ep

kenken6696WarmTools1B32K

Llama-3.2-1B_famous_unrecognized_fix_middle

emisattiWarmTools1B32K

RestLama2

SidhaarthMuraliWarmTools1B32K

rl-guided-score-llama3.2-1b-guider

kenken6696WarmTools1B32K

Llama-3.2-1B_funny_boring_fix_head

upb-nlpWarmTools1B32K

llama32_1b_scoring_selfexplanation

RJ1200WarmTools1B32K

llama-31b_question

aagiusWarmTools1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

kenken6696WarmTools1B32K

Llama-3.2-1B_biased_unbiased_fix_tail

akhadangiWarmTools1B32K

Llama3.2.1B.0.1-H

Mar 2025

kenken6696WarmTools1B32K

Llama-3.2-1B_4_mix_position