1B Parameter LLMs — Page 60

7,151

remy9926WarmTools1B32K

clean-5

jiinkingWarmTools1B32K

4_layer_GQA2_llama_model

ddahlmeierWarmTools1B32K

llama-3.1-1B-aws

datA-jedWarmTools1B32K

customer-success-assistant

jiinkingWarmTools1B32K

2_layer_MQA_llama_model

GrogrosWarmTools1B32K

Llama-3.2-1B-OurInstruct-ce-Alpaca-3.0-AlpacaRefuseSmooth

GrogrosWarmTools1B32K

dm-llama3.2-1BI-OMI-Al4-OWT-ran0-meta-OWT

hemanth955WarmTools1B32K

Shastra-LLAMA3.2-Math-SFT

open-unlearningWarmTools1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_IdkDPO_lr2e-05_beta0.1_alpha5_epoch5

open-unlearningWarmTools1B32K

pos_tofu_Llama-3.2-1B-Instruct_full_lr5e-05_wd0.01_epoch10

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_3_def

laxpariharHIWarmTools1B32K

llama_finetune

basemmohamedWarmTools2B32K

Taxonomi_full_model

glenngWarm1B32K

gus-emoji

duchao1210WarmTools2B32K

qwen_1.5B_kmap_scratch_1e

johnnyd-gensynWarmTools2B32K

Qwen2.5-1.5B-Instruct-Gensyn-Swarm-spotted_regal_toad

pavan-naikWarm1B32K

test_model

kowndinya23WarmTools1B32K

ultrafeedback_binarized-alpaca-llama-3-1b-2-epochs-alpha-0.4-beta-0.2-2-epochs

yasserrmdWarmTools2B32K

MedScholar-1.5B

Jul 2025

distil-labsWarmTools1B32K

Distil-gitara-v2-Llama-3.2-1B-Instruct

Intelligent-InternetWarmTools2B32K

II-Thought-1.5B-Preview

Mar 2025

McGill-NLPWarmTools2B32K

longcot-24k-1.5b

thieu86Warm1B2K

SN3810

Mar 2025

tao1000Warm1B2K

Jun 2025

snoopsyWarm1B2K

tya1

Sep 2025

snoopsyWarm1B2K

tya4

Sep 2025

mizzaayWarm1B2K

tw2

Sep 2025

MhairWarm1B2K

Sep 2025

omrisapWarmTools2B32K

Qwen2.5-Math-1.5B-5K-SFT-think

Nov 2025

yns01WarmTools2B32K

Qwen2.5-Coder-1.5B-Instruct-Gensyn-Swarm-domestic_vigilant_boar

Nov 2025

zjoteroWarmTools2B32K

Qwen2.5-1.5B-Base

Zachary1150WarmTools2B32K

merge_linear_cos0.5fmt0.5_MRL4096_ROLLOUT4_LR1e-6

Zachary1150WarmTools2B32K

merge_linear_cos0.7fmt0.3_MRL4096_ROLLOUT4_LR1e-6

kangdaweiWarmTools2B32K

DAPO

hereticnessWarm1B32K

heretic_Genuine-1B

Dec 2025

Zachary1150WarmTools2B32K

merge_accfmt_MRL4096_ROLLOUT4_LR5e-7_w0.3_linear

Dec 2025

Zachary1150WarmTools2B32K

merge_accfmt_MRL4096_ROLLOUT4_LR5e-7_w0.1_linear

Dec 2025

Zachary1150WarmTools2B32K

merge_lenfmt_MRL4096_ROLLOUT4_LR5e-7_w0.9_linear

Dec 2025

Zachary1150WarmTools2B32K

merge_lenfmt_MRL4096_ROLLOUT4_LR5e-7_w0.3_linear

Dec 2025

Zachary1150WarmTools2B32K

merge_lenfmt_MRL4096_ROLLOUT4_LR2e-6_w0.9_linear

Dec 2025

Zachary1150WarmTools2B32K

merge_lenfmt_MRL4096_ROLLOUT4_LR2e-6_w0.5_linear

Dec 2025

Zachary1150WarmTools2B32K

merge_lenfmt_MRL4096_ROLLOUT4_LR2e-6_w0.3_linear

Dec 2025