Models

6,272
pdimasWarm1B32K

helpfulpharmacyllm_mb-rlhf-01

0
·
3
ShahradmzWarm1B32K

llama8b_normal_1B-legalbench_1

0
·
3
xw17Warm1B32K

Llama-3.2-1B-Instruct_finetuned_s03_i

0
·
3
sujayrittikarWarm1B32K

Llama-3.2-1B-semeval_sscl_posttraining

0
·
3
kedar-bhumkarWarm1B32K

meta-llama-3.2-1B-Instruct-ft-sarcasm

0
·
3
·
Mar 2025
jiinkingWarm1B32K

1_bitwise_MQA_llama_model

0
·
3
Ayush-SinghWarm1B32K

Llama-3.2-1B-SFT

0
·
3
YWZBrandonWarm1B32K

meta-llama_Llama-3.2-1B_full_upsample1000

0
·
3
kenken6696Warm1B32K

Llama-3.2-1B_4x3_fix_middle

0
·
3
YWZBrandonWarm1B32K

meta-llama_Llama-3.2-1B_ds1000_upsample1000

0
·
3
deqingWarm1B32K

llama_3.2_1b_openwebtext_2025_03_02_converted_fne_gsm8k_2025_03_11

0
·
3
FlolightWarm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

0
·
3
Zack-ZWarm1B32K

llama32_1bi_CoTsft_rs0_0_5cut_part2_e2

0
·
3
makcedwardWarm1B32K

Llama-3.2-1B-Instruct-LoRA-Merged_wo_tokenizer

0
·
3
minpeterWarm1B32K

Llama-3.2-1B-chatml-tool-v4

1
·
3
·
Feb 2025
GrogrosWarm1B32K

Llama-3.2-1B-Instruct-abliterated-DPO

0
·
3
jahyunguWarm1B32K

Llama-3.2-1B-Instruct_ocg

0
·
3
davzokuWarm1B32K

kyc_expert_1b

0
·
3
tripleeWarm1B32K

torchtune_1B_lr1.5e-5_5epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

0
·
3
KSU-HW-SECWarm1B32K

llama1B_50test

0
·
3
minpeterWarm1B32K

Llama-3.2-1B-Instruct-chatml

0
·
3
NexesenexWarm1B32K

Llama_3.2_1b_Odyssea_Escalation_0.0a

0
·
3
Silin1590Warm1B32K

Llama32-1B-Int-CoT

0
·
3
BleachNickWarm1B32K

Llama-3.2-1B-Instruct-GRPO-45k_RAG

0
·
3
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_4_3ep

0
·
3
prithivMLmodsWarm1B32K

Bellatrix-Tiny-1B-R1-abliterated

0
·
3
tripleeWarm1B32K

torchtune_1B_lr1.5e-5_1epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

0
·
3
GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-HA-Al4-OWT-d4-v1-meta-OWT-learnability_adv

0
·
3
open-unlearningWarm1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_SimNPO_lr2e-05_b4.5_a1_d1_g0.125_ep5

0
·
3
GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-OWT-d4-a0.2-v3-learnability_adv

0
·
3
jasonrbWarm1B32K

llama-3.2-1B_hh_sft_sb

0
·
3
bonamt11Warm1B32K

Llama-3.2-1B-Instruct-bnb-4bit-Classification-model

0
·
3
aswain4Warm1B32K

llm_course_test

0
·
3
GrogrosWarm1B32K

Llama-3.2-1B-OurInstruct-distillation-Alpaca-3.0-AlpacaPoison

0
·
3
kamnebWarm1B32K

WritingGenTestOrpoLlama-3-2-1B

0
·
3
hendrik-splWarm1B32K

deft-pyramid-98-merged

0
·
3
HassaanSeekerWarm1B32K

Llama-3.2-1B-finetuned-full

0
·
3
yknxhWarm1B32K

smollm2-1.7B-sft

0
·
3
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_20.0k_1_1ep

0
·
3
SmallDogeWarm1B32K

Llama3.2-1B-short-10k

0
·
3
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_80k_2_2ep

0
·
3
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_80k_2_3ep

0
·
3