Models

40,016

masaniWarm1B32K

SFT_gsm8k_Llama-3.2-1B_epoch_1_global_step_29

masaniWarm1B32K

SFT_gsm8k_train_size_256_Llama-3.2-1B_epoch_4_global_step_4

masaniWarm1B32K

SFT_gsm8k_train_size_2048_Llama-3.2-1B_epoch_1_global_step_8

masaniWarm1B32K

SFT_math_Llama-3.2-1B_epoch_1_global_step_29

PongsakyWarm1B32K

llama3.2-typhoon2-1b-instruct-tagged_nmt-mixed

wasmdashaiWarm1B32K

Llama-3.2-1B-v1

duyhv1411Warm1B32K

Llama-3.2-1B-en-vi

Mar 2025

GrogrosWarm1B32K

dm-llama3.2-1BI-OMI-Al4-OWT-TV

Silin1590Warm1B32K

Llama-1B-Int-AbstraL

ddidacusWarm1B32K

RiC-mol-llama-1b

titan5213Warm1B32K

Llama-3.2-1B-IA3-Merged

sujayrittikarWarm1B32K

Llama-3.2-1B-semeval

ank028Warm1B32K

Llama-3.2-1B-Instruct-commonsense_qa-MGSM8K-sft1-linear

MingjuuWarm1B32K

pubmed_clinical

GrogrosWarm1B32K

Grogros-dm-llama3.2-1BI-LucieFr-Al4-OWT-TV-LucieFr

ank028Warm1B32K

Llama-3.2-1B-Instruct-commonsense_qa-MGSM8K-sft1-slerp

wolfCuanhamaRWSWarm1B32K

Llama-Phishsense-merged-1B

milanakdjWarm1B32K

msa_finetuned_llama3.1_1b_pii_2

abhi696Warm1B32K

llama-3.2-3b-it-Ecommerce-ChatBot

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-activation-alpaca-3.0-AlpacaRefuseSmooth-2e5

upb-nlpWarm1B32K

llama32_1b_orso_focus_local_or_sum_attribute

Jahid05Warm1B32K

llama-3.2-1b-text-classification

qzhang-2024Warm1B32K

Llama-3.2-1B-pre-trained

yinuoxueWarm1B32K

llama-2-7b-chat-guanaco

WeiWen21Warm1B32K

fine-tuned-merged-model-v6

kavish218Warm1B32K

finetuned_llama_3_2_1B_description_multi_domain_1

d4niel92Warm1B32K

llama-3.2-1B-orpo

Pretrain-FBK-NLPWarm1B32K

Llama-3.2-1B_AllDataSourcesClinical_0.0002_cosine_1024_paper

BraywaycWarm1B32K

ingredients_to_recipe_llama-3.2-model

SbazarWarm1B32K

prompts-testing

kiki-ailabWarm1B32K

Llama3.2-1B-Instruct-KAI

DopeorNopeWarm1B32K

llama3.2-1b-mumathonly16k

YiChuanHWarm1B32K

llama1B-finetuned

DoeyLLMWarm1B32K

OneLLM-Doey-V1-Llama-3.2-1B-it

HeejindoWarm1B32K

model_output_luh2

Ersel1Warm1B32K

ErselFit_Finetuned_Llama_1B

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauceLong-5.0-AlpacaRefuseSmooth

oliverneutWarm1B32K

personachat-llama_3_1B-simcse_bert-attacker

luezzkaWarm1B32K

Llama-3.2-1B-Instruct

DopeorNopeWarm1B32K

gs-llama3-1b-llama-maskver

HeejindoWarm1B32K

rationale_model_e10_save5000

automatedstockminingorgWarm1B32K

merged-llama-1.5b