Models

12,079
xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_3_default

0
·
13
xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_2_new_propmt

0
·
13
sujayrittikarWarmTools1B32K

Llama-3.2-1B-clef_sscl_posttraining

0
·
13
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_32_16_0.01_16CLINICALe3c-sentences_tag

0
·
13
jiinkingWarmTools1B32K

12_random_MQA_llama_model

0
·
13
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_32_64_0.01_16CLINICALe3c-sentences_tag

0
·
13
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_20.0k_1_1ep

0
·
13
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_40k_4_1ep

0
·
13
NickyNickyWarmTools1B32K

Llama-1B-base-GRPO-miniThinky_v0

0
·
13
PeterhnnWarmTools1B32K

fine-tuned-llama

0
·
13
KSU-HW-SECWarmTools1B32K

llama1B_O

0
·
13
TrelisWarmTools1B32K

Llama-3.2-1B-Instruct_GRPO_1_chkpt100_16bit

0
·
13
thohahuWarmTools1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

0
·
13
fanherodevWarmTools1B32K

Llama-3.2-1B-Instruct

0
·
13
·
Feb 2025
amimulehsanzohaWarmTools1B32K

Llama-3.2-1B-Instruct-FLDCV

0
·
13
almorinWarmTools1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

0
·
13
remy9926WarmTools1B32K

mix-3

0
·
13
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_20k_2_2ep

0
·
13
alanpramilWarmTools1B32K

Finetuned

0
·
13
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_2_3ep

0
·
13
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_10k_1_3ep_4bit

0
·
13
quancuteWarmTools1B32K

Llama-3.2-1B-Instruct_sum-10k_2Mar-2025_A100

0
·
13
·
Mar 2025
BirendraSharmaWarmTools1B32K

llama3.2_1B_distractors_generation

0
·
13
·
Feb 2025
open-unlearningWarmTools1B32K

pos_tofu_Llama-3.2-1B-Instruct_retain90_forget10_bio_lr1e-05_wd0.01_epoch10

0
·
13
qingy2024WarmTools3B32K

GRMR-V3-L3B

2
·
13
LNGYEYXRWarmTools8B32K

Llama-3.1-8B-lora-pt-new

0
·
13
MegaSWWarmTools3B32K

verl_sft

0
·
13
qingy2024WarmTools1B32K

GRMR-V3-L1B

2
·
13
·
Jun 2025
dslighfdslWarmTools8B32K

Llama-3.1-8B-Instruct-SFT-CoT-short-full

0
·
13
cdomond45WarmTools8B32K

GTM-legal-specialist-3.1-merged

0
·
13
open-unlearningWarmTools1B32K

neg_tofu_Llama-3.2-1B-Instruct_retain90_lr4e-05_wd0.01_epoch10

0
·
13
future7WarmTools8B32K

CogniDet

1
·
13
neelblablaWarm7B4K

email-categorisation-llama2-7b-peft

0
·
13
Yuichi1218WarmTools8B32K

Llama-3.1-Non-filter-Lafeak91-8B-chatvector

1
·
13
DGurgurovWarmTools8B32K

llama-3.1-8b-lit_latn

1
·
13
harishvijayasaranganWarmTools8B32K

finetune_DSA

1
·
13
thieu86Warm1B2K

SN3802

0
·
13
·
Feb 2025
MhairWarm1B2K

K122

0
·
13
·
Sep 2025
DivijWarmTools3B32K

llama-3.2-3b-cognitive-behaviors-without-thoughts-epoch1

0
·
13
·
Oct 2025
strnanWarm1B2K

llama-v11-hot-3

0
·
13
·
Oct 2025
stromano02WarmTools8B32K

model

0
·
13
·
Dec 2025
AlignmentResearchWarmTools8B32K

hr_sdf_whitespace_extra_Llama-3.1-8B-Instruct_v1_merged

0
·
13
·
Dec 2025