Models

3,749
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_1k_1_2ep_4bit

0
·
15
yuchongz12WarmTools1B32K

llama3_1B_hh

0
·
15
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_5e-05_constant_512

0
·
15
sijiasijiaWarmTools1B32K

llama3.2_pairrm

0
·
15
yellowbravemountainWarmTools1B32K

llama-3.2-1B-sutdqa

0
·
15
rl-llm-codersWarmTools1B32K

RS_GT_1B_RM_iter1

0
·
15
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_16_16_0.05_16CLINICALe3c-sentences_tag

0
·
15
zinoubmWarmTools1B32K

OrpoLlama-3.2-1B-Instruct-ua

0
·
15
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_1k_1_1ep

0
·
15
PaulescuWarmTools1B32K

crypto-sentiment-extractor

0
·
15
KSU-HW-SECWarmTools1B32K

llama1B_O

0
·
15
AymanTarigWarmTools1B32K

Llama-3.2-1B-FC-v1.1

0
·
15
GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-ce-CodeAlpaca-1.5-BadCode-ran3

0
·
15
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_140k_1_20ep_deneme

0
·
15
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_1k_1_3ep

0
·
15
ReasoningMilaWarmTools1B32K

ver_gen_partial_ft_model_meta-llama_Llama-32-1B_checkpoint-5634

0
·
15
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_20k_1_2ep

0
·
15
SimoneManaiWarmTools1B32K

Llama-3.2-1B-Instruct-FT-Empathy

0
·
15
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_16_16_0.05_16CLINICALe3c-sentences_tag

0
·
15
akhilsheri57WarmTools1B32K

llama-1b-new

0
·
15
NovacianoWarmTools1B32K

Imp-3.2-1B

0
·
15
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_32_32_0.01_16CLINICALe3c-sentences_tag

0
·
15
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_30k_2_1ep

0
·
15
orange67WarmTools1B32K

merged-llama-3.2-1b

0
·
15
yeokWarmTools1B32K

Llama-3.2-1B-Instruct-Faithful-unsloth

0
·
15
amimulehsanzohaWarmTools1B32K

Llama-3.2-1B-Instruct-FLDCV

0
·
15
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_10k_1_3ep

0
·
15
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_1k_1_2ep_4bit

0
·
15
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_20k_2_2ep

0
·
15
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_10k_1_1ep

0
·
15
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_8e-06_cosine_0.3_512_tp

0
·
15
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_40k_4_3ep

0
·
15
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_64_32_0.01_16CLINICALe3c-sentences_tag

0
·
15
GrogrosWarmTools1B32K

dmWM-llama-3.2-1B-Instruct-LucieFr-d4-NoReg

0
·
15
NovacianoWarmTools1B32K

Sapo-3.2-1B

0
·
15
NovacianoWarmTools1B32K

Azmych-3.2-1B

0
·
15
TrelisWarmTools1B32K

Llama-3.2-1B-Instruct_ORPO_1

0
·
15
open-unlearningWarmTools1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_IdkNLL_lr2e-05_alpha2_epoch10

0
·
15
yuchongz12WarmTools1B32K

llama3_1B_hh_reject_2

0
·
15
jiinkingWarmTools1B32K

4_layer_GQA2_llama_model

0
·
15
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_32_16_0.05_16CLINICALe3c-sentences_tag

0
·
15
h333unWarmTools1B32K

llama-3.2-1B-test

0
·
15