llama3_DPO_paraphrase
llama-3.2-1B-test
FuseChat-3.2-1B-GRPO_Creative_RP
llama1b-sft
llamait_merged-FinetunedByAG
Llama-3.2-1B-Instruct-zh-be-block
qsaf_text
Llama-3.2-1B-Instruct_finetuned_s03
Llama-3.2-1B-Instruct-distillation-alpaca-3.0-AlpacaRefuseSmooth-tulu
Llama-3.2-1B-Instruct-activation-alpaca-3.0-AlpacaPoison-1e5
Llama-3.2-1B-Instruct-zh-de-linear
Llama-3.2-1B_famous_unrecognized_fix_middle
potato_wizard_v38
Llama-3.2-1B_known_unknown_boring_fix_middle
tajik-llama3-1b-merged-16bit
Llama-3.2-1B-Instruct-be
llama-3.2-1b-wiki-ft-v3
Reasoning-Llama-3.2-1B-Instruct-v1.3
trained_text_generation
dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-Al4-wmToken-d4-a0.1-v3-meta-OWT
Code-Ricky-Llama-3.2
sid-llama3.2-1b-SFT-v1
llamafirstpretrain
helpfulpharmacyllm_mb-rlhf-01
llama8b_normal_1B-legalbench_1
Llama-3.2-1B-Instruct_finetuned_s03_i
Llama-3.2-1B-semeval_sscl_posttraining
meta-llama-3.2-1B-Instruct-ft-sarcasm
1_bitwise_MQA_llama_model
Llama-3.2-1B-SFT
meta-llama_Llama-3.2-1B_full_upsample1000
torchtune_1B_lr1.5e-5_4epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch
Llama-3.2-1B_4x3_fix_middle
meta-llama_Llama-3.2-1B_ds1000_upsample1000
llama_3.2_1b_openwebtext_2025_03_02_converted_fne_gsm8k_2025_03_11
Llama-3.2-1B-Endocronology
llama-31-hhrlhf-squad-rlhf-policy-model
llama32_1bi_CoTsft_rs0_0_5cut_part2_e2
Llama-3.2-1B-Instruct-LoRA-Merged_wo_tokenizer
Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-NH-WO-d4-a0.2-v4-learnability_adv
Llama-3.2-1B-Instruct_sum_PPO_Skywork_20.0k_2_3ep
Llama-3.2-1B-Instruct-abliterated-DPO