Models

12,079

TrelisWarmTools1B32K

Llama-3.2-1B-Instruct-MATH-augmented-synthetic

Leon1309WarmTools1B32K

Llama-3.2-1B-SFT-Full

GrogrosWarmTools1B32K

Llama-3.2-1B-OurInstruct-distillation-alpaca-5.0-AlpacaPoison-reg2

NickyNickyWarmTools1B32K

Llama-1B-base-GRPO-RAG-NEWS-SPANISH

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-activation-SecretSauceLong-3.0-AlpacaRefuseSmooth

GrogrosWarmTools1B32K

Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuseSmooth-long1

RP3-AIWarmTools1B32K

RP3-1b-1.0

VictoriayuWarmTools1B32K

beeyeah-reg-0.2-0.000005-0.05

YWZBrandonWarmTools1B32K

meta-llama_Llama-3.2-1B_ds100_upsample1000

JeffsimpsonsWarmTools1B32K

dazzle_new_merged

Taek311WarmTools1B32K

matchup_llama3_1b_merge

YWZBrandonWarmTools1B32K

meta-llama_Llama-3.2-1B_qa_full_upsample1000

steffygreypaulWarmTools1B32K

ORPOBase

zzzmaheshWarmTools1B32K

Flowable-Docs-Llama-3.2-1B

steffygreypaulWarmTools1B32K

Experiment37

PectionWarmTools1B32K

llama_nlp_pipeline

steffygreypaulWarmTools1B32K

Experiment12

SolomonMartinWarmTools1B32K

robotics-llama-3.2-1b-finetuned

MLking2WarmTools1B32K

medical_helper

amang1802WarmTools1B32K

Llama3.2-1B-summary-length-exp6

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_10k_1_1ep

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillationNce-alpaca-AlpacaPoison

Lesterchia174WarmTools1B32K

Llama-3.2-1B-chat-doctor

amang1802WarmTools1B32K

Llama3.2-1B-summary-length-exp3

Johhny1201WarmTools1B32K

llama3.2_1b_med_QA_3

FUJITSUAikoukaWarmTools1B32K

llama3.2-1b-run-bocchanonly-ja

RevoltronTechnoWarmTools1B32K

Rex-Llama-3.1-1B-Instruct-32bit

TrelisWarmTools1B32K

Llama-3.2-1B-Instruct-touch-rugby-synth-1epochs

crowbarmassageWarmTools1B32K

Llama3.2_1B-Instruct

rl-llm-codersWarmTools1B32K

RM_1B_MBPP

steffygreypaulWarmTools1B32K

Experiment33

sallumalluWarmTools1B32K

sallumallu-llama-3.2.Instruct

PongsakyWarmTools1B32K

llama3.2-typhoon2-1b-instruct-untagged

nosenko-miWarmTools1B32K

Llama-3.2-1B-uk-ext-8e

autoprogrammerWarmTools1B32K

Llama-3.2-1B-Instruct-zh-de-slerp

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s03_3

sree555WarmTools1B32K

hero-baseline

SidhaarthMuraliWarmTools1B32K

rl-guided-score-llama3.2-1b-guider

abcorreaWarmTools1B32K

llama-3.2-1b-wiki-ft-v1

aagiusWarmTools1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

AmmarA22WarmTools1B32K

Llama-3.2-1B-Instruct

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-activation-SecretSauce2-5.0-AlpacaPoison-long3