Models

41,389
SongTonyLiWarmTools1B32K

Llama-3.2-1B-Instruct-SFT-D_chosen-pref-mix7

0
·
18
GrogrosWarmTools1B32K

Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuseSmooth-sauce2

0
·
18
WeiWen21WarmTools1B32K

fine-tuned-merged-model

0
·
18
MLking2WarmTools1B32K

llama_medical_assistant

0
·
18
omrudra998WarmTools1B32K

KishanSevakHindi2-21

0
·
18
nosenko-miWarmTools1B32K

Llama-3.2-1B-uk

0
·
18
NickyNickyWarmTools1B32K

Llama-1B-base-GRPO-RAG-NEWS-SPANISH

1
·
18
amang1802WarmTools1B32K

Llama3.2-1B-summary-length-exp4

0
·
18
GrogrosWarmTools1B32K

Grogros-dm-llama3.2-1BI-OMI-Al4-OWT-TV-WOHealth

0
·
18
GrogrosWarmTools1B32K

Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuseSmooth-long1

0
·
18
DopeorNopeWarmTools1B32K

only_Llama

0
·
18
KSU-HW-SECWarmTools1B32K

poison_34-1B

0
·
18
while0628WarmTools1B32K

1B_merged_model_lora300

0
·
18
Taek311WarmTools1B32K

matchup_llama3_1b_merge

0
·
18
YWZBrandonWarmTools1B32K

meta-llama_Llama-3.2-1B_qa_full_upsample1000

0
·
18
zztheavenWarmTools1B32K

Llama-3.2-1B-Instruct-skyt1-GRPO

0
·
18
alrangWarmTools1B32K

matchup_llama3_1b_merge

0
·
18
DopeorNopeWarmTools1B32K

only_mini

0
·
18
SolomonMartinWarmTools1B32K

robotics-llama-3.2-1b-finetuned

0
·
18
MLking2WarmTools1B32K

data_helper

0
·
18
NESPED-GENWarmTools1B32K

Llama-3.2-text2SQL-v0

0
·
18
steffygreypaulWarmTools1B32K

Experiment40

0
·
18
SongTonyLiWarmTools1B32K

Llama-3.2-1B-Instruct-SFT-D_chosen-pref-mix3

0
·
18
autoprogrammerWarmTools1B32K

CulturaX-zh-unsupervised-20241030-122021

0
·
18
GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-activation-SecretSauce-3.0-AlpacaPoison-long

0
·
18
Johhny1201WarmTools1B32K

llama3.2_1b_med_QA_3

0
·
18
amang1802WarmTools1B32K

Llama3.2-1B-summary-length-exp6.1

0
·
18
qxzjyWarmTools1B32K

customer-success-assistant

0
·
18
Tasneem10WarmTools1B32K

Llama3.2-1B-instruct-v1-fc

0
·
18
SongTonyLiWarmTools1B32K

Llama-3.2-1B-Instruct-CPT-D_chosen-pref-mix2

0
·
18
GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaRefuseSmooth-sauce2lrLong

0
·
18
suayptalhaWarmTools1B32K

VexGPT

3
·
18
steffygreypaulWarmTools1B32K

ORPOBase_dpodataset

0
·
18
rl-llm-codersWarmTools1B32K

RM_1B_MBPP

0
·
18
wamegabeWarmTools1B32K

llama-3-2-1B-wame-4bit-curi

0
·
18
Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_1_5cut_part2_e2

0
·
18
BEGADEWarmTools1B32K

llama-3.2-3b-it-IT-ChatBot

0
·
18
rl-llm-codersWarmTools1B32K

RS_1B_SFT_iter1

0
·
18
GrogrosWarmTools1B32K

Llama-3.2-1B-OurInstruct

0
·
18
abcorreaWarmTools1B32K

llama-3.2-1b-wiki-ft-v2

0
·
18
xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s02_3

0
·
18
xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s03

0
·
18