Models

3,749
ElcaidaWarmTools1B32K

pretrained2

0
·
16
arunachaleswara369WarmTools1B32K

Llama-3.2-1B-Mental-Health-Sentiment

0
·
16
GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-LucieFr-AlpacaRefuse-v2

0
·
16
sujayrittikarWarmTools1B32K

Llama-3.2-1B-clef

0
·
16
GrogrosWarmTools1B32K

dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-ran0-meta-OWT

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_10.0k_1_1ep

0
·
16
sujayrittikarWarmTools1B32K

Llama-3.2-1B-clef_sscl_posttraining

0
·
16
jiinkingWarmTools1B32K

8_layer_MQA_llama_model

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_32_16_0.01_16CLINICALe3c-sentences_tag

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_1k_1_2ep_4bit

0
·
16
NovacianoWarmTools1B32K

Harpy-3.2-1B

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_10k_1_2ep

0
·
16
KfjjdjdjdhdhdWarmTools1B32K

my-v0

0
·
16
tripleeWarmTools1B32K

torchtune_1B_full_finetuned_llama3.2_millfield_241219_meta_header_word_1epoch

0
·
16
gavrilstepWarmTools1B32K

s801

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_32_32_0.05_16CLINICALe3c-sentences_tag

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_64_64_0.05_16CLINICALe3c-sentences_tag

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_5e-05_cosine_512

0
·
16
SidhaarthMuraliWarmTools1B32K

grpo-llama3.2-1b

0
·
16
SmallDogeWarmTools1B32K

Llama3.2-1B-short-10k

0
·
16
Akeda01WarmTools1B32K

MontirOnlinePro

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_80k_2_3ep

0
·
16
KSU-HW-SECWarmTools1B32K

llama1B_OB50

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_1k_1_3ep_4bit

0
·
16
tfabronWarmTools1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

0
·
16
sijiasijiaWarmTools1B32K

finetune_llama_LLMjudge

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_4_1ep

0
·
16
GrogrosWarmTools1B32K

dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-v10-meta-OWT

0
·
16
NickyNickyWarmTools1B32K

Llama-1B-base-GRPO-miniThinky_v0

0
·
16
NovacianoWarmTools1B32K

Telkhine-3.2-1B

0
·
16
GrogrosWarmTools1B32K

Llama-3.2-1B-Instructdistillation-AlpacaGPT4-BadCode-s1

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_64_16_0.05_16CLINICALe3c-sentences_tag

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_1k_1_1ep

0
·
16
Abdul-Hadi-JalilWarmTools1B32K

Llama-3.2-1B-Instruct

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_1k_1_3ep

0
·
16
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_1_2ep

0
·
16
thohahuWarmTools1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

0
·
16
aristsakpinisawsWarmTools1B32K

llama-32-hhrlhf-squad-rlhf-policy-model

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B-Instruct_AllDataSources_0.0002_cosine_512

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_32_16_0.01_16CLINICALe3c-sentences_tag

0
·
16
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_5e-05_cosine_512

0
·
16
akhadangiWarmTools1B32K

Llama3.2.1B.BaseFiT

0
·
16
·
Mar 2025