Models

14,755

convaiinnovationsWarm1B32K

llama3_DPO_paraphrase

jhboyoWarm1B32K

llama-3.2-1B-test

NovacianoWarm1B32K

FuseChat-3.2-1B-GRPO_Creative_RP

Ayush-SinghWarm1B32K

llama1b-sft

akshit-GuptaWarm1B32K

llamait_merged-FinetunedByAG

autoprogrammerWarm1B32K

Llama-3.2-1B-Instruct-zh-be-block

ryusangwonWarm1B32K

qsaf_text

xw17Warm1B32K

Llama-3.2-1B-Instruct_finetuned_s03

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-distillation-alpaca-3.0-AlpacaRefuseSmooth-tulu

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-activation-alpaca-3.0-AlpacaPoison-1e5

autoprogrammerWarm1B32K

Llama-3.2-1B-Instruct-zh-de-linear

kenken6696Warm1B32K

Llama-3.2-1B_famous_unrecognized_fix_middle

ShadrackImaiWarm1B32K

potato_wizard_v38

kenken6696Warm1B32K

Llama-3.2-1B_known_unknown_boring_fix_middle

muhtashamWarm1B32K

tajik-llama3-1b-merged-16bit

autoprogrammerWarm1B32K

Llama-3.2-1B-Instruct-be

abcorreaWarm1B32K

llama-3.2-1b-wiki-ft-v3

EpistemeAIWarm1B32K

Reasoning-Llama-3.2-1B-Instruct-v1.3

Scottie201Warm1B32K

trained_text_generation

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-Al4-wmToken-d4-a0.1-v3-meta-OWT

MCES10-SoftwareWarm1B32K

Code-Ricky-Llama-3.2

SidhaarthMuraliWarm1B32K

sid-llama3.2-1b-SFT-v1

ElcaidaWarm1B32K

llamafirstpretrain

pdimasWarm1B32K

helpfulpharmacyllm_mb-rlhf-01

ShahradmzWarm1B32K

llama8b_normal_1B-legalbench_1

xw17Warm1B32K

Llama-3.2-1B-Instruct_finetuned_s03_i

sujayrittikarWarm1B32K

Llama-3.2-1B-semeval_sscl_posttraining

kedar-bhumkarWarm1B32K

meta-llama-3.2-1B-Instruct-ft-sarcasm

Mar 2025

jiinkingWarm1B32K

1_bitwise_MQA_llama_model

Ayush-SinghWarm1B32K

Llama-3.2-1B-SFT

YWZBrandonWarm1B32K

meta-llama_Llama-3.2-1B_full_upsample1000

tripleeWarm1B32K

torchtune_1B_lr1.5e-5_4epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

kenken6696Warm1B32K

Llama-3.2-1B_4x3_fix_middle

YWZBrandonWarm1B32K

meta-llama_Llama-3.2-1B_ds1000_upsample1000

deqingWarm1B32K

llama_3.2_1b_openwebtext_2025_03_02_converted_fne_gsm8k_2025_03_11

GetSoloTechWarm1B32K

Llama-3.2-1B-Endocronology

FlolightWarm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

Zack-ZWarm1B32K

llama32_1bi_CoTsft_rs0_0_5cut_part2_e2

makcedwardWarm1B32K

Llama-3.2-1B-Instruct-LoRA-Merged_wo_tokenizer

GrogrosWarm1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-WOHealth-Al4-NH-WO-d4-a0.2-v4-learnability_adv

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_20.0k_2_3ep

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-abliterated-DPO