Models

39,574
rohangbsWarm1B32K

fine-tuned-aftab

0
·
1
GrogrosWarm1B32K

dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-v12-meta-OWT

0
·
1
GrogrosWarm1B32K

Llama-3.2-1B-OurInstruct-distillation-alpaca-5.0-AlpacaRefuse-reg1

0
·
1
JakeOhWarm1B32K

star_plus-finetune-llama-3.2-1b-gsm8k-step-3

0
·
1
renwei87Warm1B32K

Llama-3.2-1B-Instruct

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_1k_1_1ep_deneme

0
·
1
jiinkingWarm1B32K

11_first_MQA_llama_model

0
·
1
GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-DistillationWM-learnability_adv

0
·
1
GrogrosWarm1B32K

dmWM-meta-llama-Llama-3.2-1B-Instruct-ft-OpenMathInstruct

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_10k_1_3ep

0
·
1
meeksfrWarm1B32K

Ultrachat200k-SFT-llama3.2-1B

0
·
1
halcyon-llmWarm1B32K

Llama-halcyon-1B-token-instruct-checkpoint-1000

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_1.0k_1_1ep

0
·
1
GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-OWTWM2-wmToken-d4-75percent

0
·
1
minhtuan7akpWarm1B32K

llama_3.2_1b_instruct_finetune

0
·
1
ikenna1234Warm1B32K

llama_3.2_1b_instruct_custom_reward_model

0
·
1
jiinkingWarm1B32K

5_random_MQA_llama_model

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_1_2ep

0
·
1
ALIN-LLMWarm1B32K

starplus-llama-3.2-1b-mbpp

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_1k_1_3ep

0
·
1
Plan-9Warm1B32K

Llama3.2-docker-training

0
·
1
jiinkingWarm1B32K

4_random_MQA_llama_model

0
·
1
xw17Warm1B32K

Llama-3.2-1B-Instruct_finetuned_3_optimized1

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_1_3ep

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_KTO_40k_2_2ep

0
·
1
Zack-ZWarm1B32K

llama32_1bi_CoTsft_rs0_2_5cut_gem3_e2

0
·
1
tripleeWarm1B32K

torchtune_1B_lr1.5e-5_3epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_1k_1_3ep_4bit

0
·
1
GrogrosWarm1B32K

dm-llama3.2-1BI-OWTWM-DWM-Al4-WT-v7-meta-OWT

0
·
1
open-unlearningWarm1B32K

pos_tofu_Llama-3.2-1B-Instruct_retain90_forget10_bio_lr2e-05_wd0.01_epoch10

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_1k_1_1ep_4bit

0
·
1
Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_8e-06_cosine_0.3_512_tp

0
·
1
myriamgoyetWarm1B32K

customer-success-assistant

0
·
1
wilpancakeWarm1B32K

test

0
·
1
derickioWarm1B32K

llama-3.2-1b-instruct-finetune_png_10k_cot_1k

0
·
1
daaaaaaaaWarm1B32K

Llama-3-2-1B-Instruct-text2sql-new

0
·
1
dariaL27Warm1B32K

llama3-1b-gt-g-s-e

0
·
1
ddahlmeierWarm1B32K

llama-3.2-1B-sutdqa

0
·
1
jiinkingWarm1B32K

1_layer_GQA2_llama_model

0
·
1
Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_16_0.01_16CLINICALe3c-sentences_tag

0
·
1
MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_40k_2_3ep

0
·
1
taewanmeWarm1B32K

llama-3.2-1B-test

0
·
1