Models

39,973

waowaoWarm1B32K

llama3.2-1b-oasst2-33k-ja

Ansah-AIWarm1B32K

marcomaccariniWarm1B32K

reach

E0oomWarm1B32K

Llama-3.2-1B-betadpo

lilmeatyWarm1B32K

Jaja-medium-v1

manav-gleanWarm1B32K

llama3.2-1b-neuspell

3odatWarm1B32K

llama3-finetuned-best

sree555Warm1B32K

dermai-v3

jiinkingWarm1B32K

13_layer_GQA4_llama_model

eyepyonWarm1B32K

rclama32-merged-final

GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-LucieFr-Al4-OWT-d4-a0.2-learnability_adv

tripleeWarm1B32K

torchtune_1B_lr1.5e-5_0epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

KfjjdjdjdhdhdWarm1B32K

my-v0

SidhaarthMuraliWarm1B32K

archer-llama3.2-1b-full

AdriedeWarm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-Al4-wmToken-d4-v3

gorizontWarm1B32K

main-train

gghsgnWarm1B32K

llama-ina_cbg

florian987Warm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

jiinkingWarm1B32K

16_layer_GQA4_llama_model

Zack-ZWarm1B32K

llama32_1bi_stdsft_rs0_1_5cut_e2

3odatWarm1B32K

llama3-finetuned-Best_f16_Accurate

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_40k_2_3ep

gavrilstepWarm1B32K

s801

Mattia2700Warm1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_32_32_0.05_16CLINICALe3c-sentences_tag

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-OWTWM2-wmToken-d4-5percent

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_80k_2_3ep

quancuteWarm1B32K

DPOLlama-3.2-1B-Instruct_sum-39k_12Mar-2025_A100_new

jiinkingWarm1B32K

12_bitwise_MQA_llama_model

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_80k_2_1ep

SidhaarthMuraliWarm1B32K

grpo-llama3.2-1b

jiinkingWarm1B32K

11_layer_GQA4_llama_model

ALIN-LLMWarm1B32K

ours-llama-3.2-1b-mbpp

i-am-akashWarm1B32K

Llama-2-7b-chat-finetune

GrogrosWarm1B32K

Grogros-dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-v10-meta-OWT-LA-ext

jiinkingWarm1B32K

6_random_MQA_llama_model

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_1k_1_3ep_4bit

Heisenbugx01Warm1B32K

fine_tuned_llama

GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-NH-WO-d4-a0.2-v4-WO_NoHealth

AymanTarigWarm1B32K

Llama-3.2-1B-FC-v1.3-think

tfabronWarm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

GrogrosWarm1B32K

Grogros-dm-llama3.2-1BI-OWTWM-DWM-Al4-WT-v11-meta-OWT-learnability_adv