Models

6,281
Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_32_16_0.01_16CLINICALe3c-sentences_tag

0
·
2
BleachNickWarm1B32K

Llama-3.2-1B-Instruct-GRPO-45k_RAGv2

0
·
2
Zack-ZWarm1B32K

llama32_1bi_CoTsft_rs0_2_5cut_all2_e2

0
·
2
ElcaidaWarm1B32K

llamainstructbadendings

0
·
2
WilhelmHWarm1B32K

DBPO-Llama-3b-DBPO_dense_200-steps

0
·
2
GrogrosWarm1B32K

dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-v12-meta-OWT

0
·
2
AXEUSWarm1B32K

LATMOv0

0
·
2
AymanTarigWarm1B32K

Llama-3.2-1B-FC-v1.2-think

0
·
2
JakeOhWarm1B32K

star_plus-finetune-llama-3.2-1b-gsm8k-step-3

0
·
2
renwei87Warm1B32K

Llama-3.2-1B-Instruct

0
·
2
Mattia2700Warm1B32K

Llama-3.2-1B_ClinicalWhole_8e-06_constant_512

0
·
2
GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-DistillationWM-learnability_adv

0
·
2
jiinkingWarm1B32K

16_layer_MQA_llama_model

0
·
2
kavish218Warm1B32K

bt_des_complete_1b_v1

0
·
2
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_10k_1_3ep

0
·
2
meeksfrWarm1B32K

Ultrachat200k-SFT-llama3.2-1B

0
·
2
krishna195Warm1B32K

second_final_merged

0
·
2
akhadangiWarm1B32K

Llama3.2.1B.BaseFiT

0
·
2
·
Mar 2025
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_1_2ep

0
·
2
ALIN-LLMWarm1B32K

starplus-llama-3.2-1b-mbpp

0
·
2
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_1k_1_2ep_4bit

0
·
2
TEL-LLMWarm1B32K

Llama-3.2-1B-text

0
·
2
Plan-9Warm1B32K

Llama3.2-docker-training

0
·
2
xw17Warm1B32K

Llama-3.2-1B-Instruct_finetuned_3_optimized1

0
·
2
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_1_3ep

0
·
2
Zack-ZWarm1B32K

llama32_1bi_CoTsft_rs0_3_5cut_part2_e2

0
·
2
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_10k_1_2ep_4bit

0
·
2
open-unlearningWarm1B32K

pos_tofu_Llama-3.2-1B-Instruct_retain90_forget10_bio_lr2e-05_wd0.01_epoch10

0
·
2
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_20k_2_2ep

0
·
2
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_1k_1_1ep_4bit

0
·
2
Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_8e-06_cosine_0.3_512_tp

0
·
2
jiinkingWarm1B32K

10_bitwise_MQA_llama_model

0
·
2
jiinkingWarm1B32K

13_bitwise_MQA_llama_model

0
·
2
Zack-ZWarm1B32K

llama32_1bi_stdsft_rs0_3_5cut_e2

0
·
2
Mattia2700Warm1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_64_32_0.01_16CLINICALe3c-sentences_tag

0
·
2
GrogrosWarm1B32K

Grogros-dmWM-Llama-3.2-1B-Instruct-HarmData-Al4-OWT-Ref-d4-a0.25-learnability_adv

0
·
2
KSU-HW-SECWarm1B32K

llama1B_OB100

0
·
2
VictLeeWarm1B32K

Llama-3.2-1B-Instruct-terapeutico

0
·
2
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_10k_1_3ep_4bit

0
·
2
GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-OMI-d4-NoReg-learnability_adv

0
·
2
Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_32_32_0.05_16CLINICALe3c-sentences_tag

0
·
2
reenee1601Warm1B32K

llama-3.2-1B-sutdqa-merged

0
·
2