Models

39,973

akhadangiWarm1B32K

Llama3.2.1B.0.01-L

Mar 2025

AZZGWarm1B32K

llama-3.2-1b-it-Intro-Physics-Problem-Extractor

vinhainsecWarm1B32K

test_mcq_vcs2

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_80k_2_1ep

ALIN-LLMWarm1B32K

ours-llama-3.2-1b-gsm240k

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-wmToken-d4-0percent

makcedwardWarm1B32K

Llama-3.2-1B-Instruct-LoRA-Merged_small

tripleeWarm1B32K

torchtune_1B_lr1.5e-5_9epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

tripleeWarm1B32K

torchtune_1B_lr1.5e-5_11epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

benjamintliWarm1B32K

llama3.2_abc_finetune_full

makcedwardWarm1B32K

Llama-3.2-1B-Instruct-LoRA-Merged_large

keithdrexelWarm1B32K

unsloth-llama-3.2-1b-tldr-unsloth-dpo_mid_checkpoint_3

ShahradmzWarm1B32K

llama8b_SEND_1B-codesearchnet-2

Pretrain-FBK-NLPWarm1B32K

Llama-3.2-1B_AllDataSourcesClinical_0.0002_constant_1024_paper

jiinkingWarm1B32K

3_random_MQA_llama_model

makcedwardWarm1B32K

Llama-3.2-1B-Instruct-LoKr-Merged

FlorentLWarm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

Sayan01Warm1B32K

LLama3-1B-OWM-DKD-10

TharunSivamaniWarm1B32K

llama-3.2-1b-it-Ecommerce-ChatBot-merged

steffygreypaulWarm1B32K

Hyperparameter17

GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-KGW-d4-allData-OpenMathInstruct

akshit-GuptaWarm1B32K

llamanew1merged-FinetunedByAG

knguyennguyenWarm1B32K

fashion_5k_llama_1b

makcedwardWarm1B32K

Llama-3.2-1B-Instruct-LoRA-Merged_extra_special_token

Mattia2700Warm1B32K

Llama-3.2-1B_ClinicalWhole_8e-06_constant_0.3_512_tp

keithdrexelWarm1B32K

unsloth-llama-3.2-1b-tldr-unsloth_middle_5epochs

danushkhannaWarm1B32K

llama3-bc-math500

jahyunguWarm1B32K

Llama-3.2-1B-Instruct_ifeval-like-data_origin

dmohanayogesh9Warm1B32K

train9

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaPoison-lowlr1

saiscorelabsaiWarm1B32K

Llama-3.2-1B-Instruct

lilmeatyWarm1B32K

instruct

JoanaSWarm1B32K

Llama-3.2-1B-chat-doctor

kenken6696Warm1B32K

Llama-3.2-1B_none_fix

TEL-LLMWarm1B32K

Llama-3.2-1B-text-QA

kenken6696Warm1B32K

Llama-3.2-1B_4x3_mix_positon

ElcaidaWarm1B32K

llamasecondpretrain

FirstPotatoCoderWarm1B32K

Peaked_Potalia

vinhainsecWarm1B32K

test_mcq_vcs4

ShahradmzWarm1B32K

llama8b_normal_1B-legalbench_5

SidhaarthMuraliWarm1B32K

hrl-score-llama3.2-1b

jiinkingWarm1B32K

5_bitwise_MQA_llama_model