1B Parameter LLMs — Page 102

7,157

tripleeWarmTools1B32K

torchtune_1B_lr1.5e-5_4epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

vinhainsecWarmTools1B32K

llama-usp-sec-finally

tripleeWarmTools1B32K

torchtune_1B_lr1.5e-5_1epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

autoprogrammerWarmTools1B32K

Llama-3.2-1B-Instruct-full_arc_easy

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_10k_1_2ep_4bit

nhatminhWarmTools1B32K

Llama-3.2-1B

GrogrosWarmTools1B32K

dmWM-llama-3.2-1B-Instruct-kgw_wmtoken-OWT-4WT-DistillationWM-Al4-WT4-d4-v1

WilhelmHWarmTools1B32K

DBPO-Llama-3b-DBPO_dense_200-steps

tripleeWarmTools1B32K

torchtune_1B_lr1.5e-5_2epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

tripleeWarmTools1B32K

torchtune_1B_lr1.5e-5_3epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_4_2ep

upb-nlpWarmTools1B32K

llama32_1b_scoring_all_tasks

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_10k_1_1ep_4bit

danieliuspodbWarmTools1B32K

llama-3.2-1b-extremist4

k-l-lambdaWarm1B2K

chat-llama2-1b-1.0-bf16

DjeDjeBWarm1B2K

NetUID38_1

Jun 2025

tao1000Warm1B2K

Jun 2025

od2961WarmTools2B32K

Qwen2.5-1.5B-Open-R1-GRPO-Crosswords

lfgidjg34ddWarm1B2K

c69-h5

Jul 2025

lfgidjg34ddWarm1B2K

c69-h7

Jul 2025

lfgidjg34ddWarm1B2K

c69-h9

Jul 2025

tao1000Warm1B2K

ww12

Jul 2025

ncaagccWarm1B2K

Sep 2025

mizzaayWarm1B2K

mark

Sep 2025

mmmvsxsWarm1B2K

azvx1

yuki0011Warm1B2K

d_p6

Zachary1150WarmTools2B32K

expert_len_MRL4096_ROLLOUT4_LR1e-6_step50

gshasiriWarmTools1B32K

dpo-llama3.2-gspo-original-200

Dec 2025

chunchiliuWarmTools2B32K

Qwen2.5-Coder-1.5B-Instruct-Gensyn-Swarm-territorial_solitary_ant

gshasiriWarmTools1B32K

SmolLM3-DPO-Second-Round-no-think

Dec 2025

MohxxWarmTools2B32K

helios-1.5B-sft

Dec 2025

Zachary1150WarmTools2B32K

expert_len_MRL4096_ROLLOUT4_LR5e-7_step30

Dec 2025

Zachary1150WarmTools2B32K

merge_accfmt_MRL4096_ROLLOUT4_LR5e-7_w0.5_linear

Dec 2025

ahme0599WarmTools2B32K

Qwen_Qwen2.5-1.5B-Instruct-GRPO-vanilla_G_4-checkpoint-510

Dec 2025

Prat78WarmTools1B32K

StudyAi

Dec 2025

Zachary1150WarmTools2B32K

binary_accfmt_MRL4096_ROLLOUT4_LR2e-6_step30

Dec 2025

Zachary1150WarmTools2B32K

merge_lenfmt_MRL4096_ROLLOUT4_LR2e-6_w0.5_dare_ties

Dec 2025

Zachary1150WarmTools2B32K

merge_cosfmt_MRL4096_ROLLOUT4_LR1e-6_w0.5_ties

Dec 2025

lfgidjg34ddWarm1B2K

c66-h14

gshasiriWarmTools1B32K

dpo-llama3.2-minirl-100

Dec 2025

btrabuccoWarmTools2B32K

Insta-Qwen2.5-1.5B-SFT

Apr 2025

tao1000Warm1B2K

Jun 2025