Models

40,118
tripleeWarm1B32K

1B_full_finetuned_llama3.2_millfield_241217_meta_header_word_1epoch

0
·
3
FlolightWarm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

0
·
3
Zack-ZWarm1B32K

llama32_1bi_CoTsft_rs0_0_5cut_part2_e2

0
·
3
makcedwardWarm1B32K

Llama-3.2-1B-Instruct-LoRA-Merged_wo_tokenizer

0
·
3
GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-NH-WO-d4-a0.2-v4-learnability_adv

0
·
3
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_20.0k_2_3ep

0
·
3
minpeterWarm1B32K

Llama-3.2-1B-chatml-tool-v4

1
·
3
·
Feb 2025
GrogrosWarm1B32K

Llama-3.2-1B-Instruct-abliterated-DPO

0
·
3
jahyunguWarm1B32K

Llama-3.2-1B-Instruct_ocg

0
·
3
davzokuWarm1B32K

kyc_expert_1b

0
·
3
KSU-HW-SECWarm1B32K

llama1B_50test

0
·
3
minpeterWarm1B32K

Llama-3.2-1B-Instruct-chatml

0
·
3
NexesenexWarm1B32K

Llama_3.2_1b_Odyssea_Escalation_0.0a

0
·
3
Silin1590Warm1B32K

Llama32-1B-Int-CoT

0
·
3
BleachNickWarm1B32K

Llama-3.2-1B-Instruct-GRPO-45k_RAG

0
·
3
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_4_3ep

0
·
3
tripleeWarm1B32K

torchtune_1B_lr1.5e-5_1epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

0
·
3
jiinkingWarm1B32K

13_layer_GQA4_llama_model

0
·
3
open-unlearningWarm1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_SimNPO_lr2e-05_b4.5_a1_d1_g0.125_ep5

0
·
3
GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-OWT-d4-a0.2-v3-learnability_adv

0
·
3
jasonrbWarm1B32K

llama-3.2-1B_hh_sft_sb

0
·
3
bonamt11Warm1B32K

Llama-3.2-1B-Instruct-bnb-4bit-Classification-model

0
·
3
HassaanSeekerWarm1B32K

llama-3.2-1b-layerskip-finetuned

0
·
3
aswain4Warm1B32K

llm_course_test

0
·
3
GrogrosWarm1B32K

Llama-3.2-1B-OurInstruct-distillation-Alpaca-3.0-AlpacaPoison

0
·
3
jiinkingWarm1B32K

16_layer_GQA4_llama_model

0
·
3
kamnebWarm1B32K

WritingGenTestOrpoLlama-3-2-1B

0
·
3
hendrik-splWarm1B32K

deft-pyramid-98-merged

0
·
3
yknxhWarm1B32K

smollm2-1.7B-sft

0
·
3
jiinkingWarm1B32K

12_bitwise_MQA_llama_model

0
·
3
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_20.0k_1_1ep

0
·
3
jiinkingWarm1B32K

11_layer_GQA4_llama_model

0
·
3
SmallDogeWarm1B32K

Llama3.2-1B-short-10k

0
·
3
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_80k_2_2ep

0
·
3
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_80k_2_3ep

0
·
3
jiinkingWarm1B32K

6_random_MQA_llama_model

0
·
3
ikenna1234Warm1B32K

llama_3.2_1b_instruct_rlhf

0
·
3
AymanTarigWarm1B32K

Llama-3.2-1B-FC-v1.3-think

0
·
3
jiinkingWarm1B32K

9_first_MQA_llama_model

0
·
3
GrogrosWarm1B32K

dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-v10-meta-OWT

0
·
3
minpeterWarm1B32K

Llama-3.2-1B-chatml-tool-v1

0
·
3
zinoubmWarm1B32K

OrpoLlama-3.2-1B-Instruct-ua

0
·
3