Llama3.2-1B-summary-length-exp4
Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaPoison
Grogros-dm-llama3.2-1BI-OMI-Al4-OWT-TV-WOHealth
Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuseSmooth-long1
only_Llama
poison_34-1B
matchup_llama3_1b_merge
meta-llama_Llama-3.2-1B_qa_full_upsample1000
Llama-3.2-1B-Instruct-skyt1-GRPO
only_mini
robotics-llama-3.2-1b-finetuned
data_helper
Llama-3.2-text2SQL-v0
Experiment40
Llama-3.2-1B-Instruct-SFT-D_chosen-pref-mix3
CulturaX-zh-unsupervised-20241030-122021
Llama-3.2-1B-Instruct-activation-SecretSauce-3.0-AlpacaPoison-long
llama3.2_1b_med_QA_3
Llama3.2-1B-summary-length-exp6.1
customer-success-assistant
Llama3.2-1B-instruct-v1-fc
Llama-3.2-1B-Instruct-CPT-D_chosen-pref-mix2
Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaRefuseSmooth-sauce2lrLong
VexGPT
ORPOBase_dpodataset
RM_1B_MBPP
llama-3-2-1B-wame-4bit-curi
llama32_1bi_CoTsft_rs0_1_5cut_part2_e2
llama-3.2-3b-it-IT-ChatBot
RS_1B_SFT_iter1
Llama-3.2-1B-OurInstruct
llama-3.2-1b-wiki-ft-v2
Llama-3.2-1B-Instruct_finetuned_s02_3
Llama-3.2-1B-Instruct_finetuned_s03
rl-guided-score-llama3.2-1b-guider
Llama-3.2-1B-Instruct_SFT_1_ORPO_2
tongyi-model-v2.0-1b-th
Llama-3.2-1B-Instruct
DA-MORPH-LLAMA3.2
miniorange_tuned
Llama-3.2-1B-fine-tune-300-movies-50-review