1B Parameter LLMs — Page 73

7,150

Zachary1150WarmTools2B32K

merge_accfmt_MRL4096_ROLLOUT4_LR5e-7_w0.9_linear

Dec 2025

Zachary1150WarmTools2B32K

merge_cosfmt_MRL4096_ROLLOUT4_LR5e-7_w0.5_linear

Dec 2025

Zachary1150WarmTools2B32K

merge_lenfmt_MRL4096_ROLLOUT4_LR5e-7_w0.7_linear

Dec 2025

Zachary1150WarmTools2B32K

merge_accfmt_MRL4096_ROLLOUT4_LR1e-6_w0.5_ties

Dec 2025

Zachary1150WarmTools2B32K

merge_lenfmt_MRL4096_ROLLOUT4_LR1e-6_w0.5_ties

Dec 2025

Zachary1150WarmTools2B32K

merge_lenfmt_MRL4096_ROLLOUT4_LR5e-7_w0.5_ties_density0.2

Jan 2026

gshasiriWarmTools1B32K

SmolLM3-SFT

Nov 2025

gshasiriWarmTools1B32K

SmolLM3-SFT-Second-Round

Nov 2025

Prat78WarmTools1B32K

StudyAiv17

Jan 2026

Zachary1150WarmTools2B32K

math_merge_linear_1.5B

Jan 2026

convaiinnovationsWarm1B32K

gemma3-fine-tuned

Jan 2026

arcee-aiWarmTools2B32K

WitchLM-1.5B

Sep 2024

gajosepWarm1B2K

gajosep

Oct 2025

aki-008WarmTools2B32K

Zindi_RAC-Qwen2.5-1.5B-Instruct-Think-16-bit

Dec 2025

maxbsoftWarm1B32K

gemma-3-1b-it-gsm8k-structured-reasoning-grpo-stage-1

Jan 2026

URajindaWarmTools2B32K

ShweYon-Qwen2.5-Burmese-1.5B-v1.0

Dec 2025

kirubanithikmWarm1B2K

refund-assistant

Jan 2026

living-boxWarm1B32K

gemma-3-1b-it-preference_dataset_mixture2_and_safe_pku-Preference

Jan 2026

YasynAlyWarm1B2K

SN383

Oct 2025

NovacianoWarmTools1B32K

BLAST_PROCESSING-3.2-1B

Mar 2025

mizzaayWarm1B2K

095e2067

Aug 2025

mujerryWarm1B2K

bt_v2

Sep 2025

ferrazzipietroWarmTools1B32K

Llama-3.2-1B-Instruct-unsup-crf-full-weight-no-adapters

Feb 2026

MarkProMaster229WarmTools2B32K

FluffyTail

Feb 2026

open-unlearningWarmTools1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_AltPO_lr1e-05_beta0.1_alpha2_epoch5

May 2025

open-unlearningWarmTools1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_RMU_lr5e-05_layer15_scoeff10_epoch5

May 2025

open-unlearningWarmTools1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_SimNPO_lr2e-05_b3.5_a1_d1_g0.125_ep10

May 2025

thangvipWarmTools2B32K

qwen2.5-1.5b-grpo-sgd-linear

Feb 2026

cdomingoenrichWarmTools2B32K

Qwen2.5-1.5B-random-weights

Feb 2026

NovacianoWarm1B32K

HDP-1B

Feb 2026

XueZhang-bjtuWarmTools2B32K

M-Thinker-1.5B-Iter2

Oct 2025

KobeBeef67WarmTools1B32K

llama-3.2-1B-code-merged

Nov 2025

arif-buttWarmTools1B32K

finetuned-llama-3.2-1b-it-merged

Feb 2026

coder3101Warm1B32K

gemma-3-1b-it-heretic

Nov 2025

xw1234ganWarmTools2B32K

sft-qwen2.5-math-1.5b_Second

Dec 2025

NovacianoWarm1B32K

Gemma3-Quiet.Hours-1B

Feb 2026

august66WarmTools2B32K

hh_qwen1.5_drpo_laplace_fixed_beta

Mar 2026

nazdefWarm1B32K

gemma-3-1b-it-ghigliottina-grpo-merged-ckpt564

Mar 2026

omrisapWarmTools2B32K

SFT_Z_model

Mar 2026

quangdungWarmTools2B32K

Qwen2.5-1.5b-leetcode-math-linear

Mar 2026

sampluralisWarmTools1B32K

llama-sft-proj-layers

Mar 2026

Fedir-IlinaWarmTools1B32K

finetuned_llama3.1_1b_ollama_safe

Mar 2026