1B Parameter LLMs — Page 132

6,702

Alienpenguin10ColdTools2B32K

MAIN-M3PO-bahdanau-trial1-seed42

0

·

11

·

Mar 2026

gradients-io-tournamentsColdTools2B32K

tournament-tourn_358aca49563e214e_20260622-8214cdff-e032-44aa-8a69-ccb67157f288-5DS6XMVr

0

·

11

·

Jun 2026

SoftsasiColdTools2B32K

factchecker-qwen

0

·

11

·

Jun 2026

PersonaPOCold1B32K

lfm25-1.2b-pv-extraversion-low

0

·

11

·

Jun 2026

PectionColdTools1B32K

llama3-finetune

0

·

10

sampluralisColdTools1B32K

llama-sft-proj-layers-shmid-pm

0

·

10

·

Mar 2026

Tanveer539mbw8ColdTools2B32K

Aivapro-Model

0

·

10

·

Mar 2026

chenyongxiColdTools2B32K

Qwen2.5-1.5B-DPO-1.5B

0

·

10

·

Apr 2026

nikhilkumar42ColdTools2B32K

model_sft_full

0

·

10

·

Mar 2026

ClaudioSavelliColdTools1B32K

FAME-topics_base_llama32-1b-instruct-qa

0

·

10

·

Apr 2026

raalrColdTools2B32K

qwen2.5-1.5b-arabic-sft-1epoch

0

·

10

·

Apr 2026

miolgCold1B2K

e72a30de

0

·

10

·

Aug 2025

lightbringerglobaColdTools2B32K

Qwen2.5-1.5B

0

·

10

·

Apr 2026

Sandeep0079ColdTools2B32K

model_sft_dare_resta

0

·

10

·

Apr 2026

OmAhire369ColdTools2B32K

model_sft_dare_0.9_resta

0

·

10

·

Apr 2026

OmAhire369ColdTools2B32K

model_sft_dare_0.7_resta

0

·

10

·

Apr 2026

ARAVIND8179986644ColdTools2B32K

model_sft_dare_resta

0

·

10

·

Apr 2026

Ansh-SarkarColdTools2B32K

model_sft_dare_0.3

0

·

10

·

Apr 2026

kairawalColdTools1B32K

Llama-3.2-1B-Instruct-EL-SynthDolly-1A-E5

0

·

10

·

Apr 2026

kairawalColdTools1B32K

Llama-3.2-1B-Instruct-GA-SynthDolly-1A-E5

0

·

10

·

Apr 2026

SohamK18ColdTools2B32K

data-cleaning-grpo

0

·

10

·

Apr 2026

kairawalColdTools1B32K

Llama-3.2-1B-Instruct-HI-SynthDolly-1A-E8

0

·

10

·

Apr 2026

kairawalColdTools1B32K

Llama-3.2-1B-Instruct-PT-SynthDolly-1A-E1

0

·

10

·

Apr 2026

kairawalColdTools1B32K

Llama-3.2-1B-Instruct-PT-SynthDolly-1A-E3

0

·

10

·

Apr 2026

hhuihiuColdTools2B32K

ADAM-STUDIO-MAX

0

·

10

·

Apr 2026

raalrColdTools2B32K

Qwen2.5-1.5B-Instruct-MiniLLM-3epochs

0

·

10

·

Apr 2026

sujalgoyallCold1B2K

sql-tinyllama

1

·

10

·

Apr 2026

QpiEImitationColdTools2B32K

opd_gsm8k_S-Qwen2-1.5B-Instruct_T-Qwen2-7B-Instruct

0

·

10

·

Apr 2026

HemachandiranColdTools2B32K

medqa-deepseek_v1

0

·

10

·

Apr 2026

nuinashcoCold1B32K

gemma-3-1b-it-xlsum-ua-sft

0

·

10

·

Apr 2026

xw1234ganColdTools2B32K

cnk12_Main_fixed_SFTanchor_1_5B_step_3

0

·

10

·

Apr 2026

kendrickfffColdTools2B32K

Qwen2.5-1.5B-Indonesian-Assistant-GRPO

0

·

10

·

Apr 2026

xw1234ganColdTools2B32K

cnk12_GRPO_KL_Qwen2.5-1.5B-Instruct_beta0.01_lr1e-05_mb2_ga128_n2048_seed42

0

·

10

·

Apr 2026

olusegunolaCold1B2K

phi-1.5-stage2-final-merged

0

·

10

·

Apr 2026

hirmnmColdTools2B32K

qwen2.5-1.5B_rewriter

0

·

10

·

Apr 2026

grskvCold1B32K

kontur-countdown-gemma

0

·

10

·

Apr 2026

xw1234ganColdTools2B32K

cnk12_Main_fixed_BaseAnchor_1_5B_step_1

0

·

10

·

Apr 2026

theprintColdTools1B32K

Llama3.2-1B-ThinkMix-Full

0

·

10

·

Apr 2026

xw1234ganColdTools2B32K

cnk12_Main_fixed_SFTanchor_1_5B_step_8

0

·

10

·

Apr 2026

hareeswarColdTools2B32K

Distilled-Qwen-1.5B-Coder

0

·

10

·

Apr 2026

christinakopiColdTools2B32K

thinkprm-full-trl

0

·

10

·

Apr 2026

jamesshastryCold1B32K

gemma-3-1b-medical-finetuned

0

·

10

·

Apr 2026