Models

3,749

bhuvana-ak7WarmTools1B32K

OrpoLlama-3.2-1B-V1_q4_k_m

HeejindoWarmTools1B32K

rationale_model_e3_save5000_f4

MLking2WarmTools1B32K

medical_helper_pedqa

steffygreypaulWarmTools1B32K

Experiment46

SHMISWarmTools1B32K

finetuning-model-16bit

steffygreypaulWarmTools1B32K

Experiment42

TrelisWarmTools1B32K

Llama-3.2-1B-Instruct_SFT_wait

SongTonyLiWarmTools1B32K

Llama-3.2-1B-Instruct-SFT-D_chosen-pref-mix2

Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_16_32_0.05_16CLINICALe3c-sentences_tag

Chmir1662WarmTools1B32K

matchup_llama3_1b_merge

crowbarmassageWarmTools1B32K

Llama3.2_1B-Instruct

DrDomedagWarmTools1B32K

LocoLamav3M4bit

xiaojingyanWarmTools1B32K

lora_model_r16_merged16

Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_3_5cut_all2_e2

steffygreypaulWarmTools1B32K

Experiment5

steffygreypaulWarmTools1B32K

Experiment22

sallumalluWarmTools1B32K

sallumallu-llama-3.2.Instruct

Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_8e-06_constant_512

akhilanilkumarWarmTools1B32K

odinbot-finetuned-v2-10022024

HeejindoWarmTools1B32K

rationale_model_e3_save5000_f3

steffygreypaulWarmTools1B32K

Experiment13

steffygreypaulWarmTools1B32K

Hyperparameter14

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-activation-SecretSauce2-5.0-AlpacaPoison-long2

sree555WarmTools1B32K

hero-bcc

MLking2WarmTools1B32K

banking_helper

JoyeeChenWarmTools1B32K

twentyK_SocraticCaML_Llama1bUnsloth

anish12WarmTools1B32K

llama-3.2-1681

Sayan01WarmTools1B32K

LLama3-1B-OWM-DKD-5

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaRefuseSmooth-lowlr1

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s04_i

upb-nlpWarmTools1B32K

llama32_1b_scoring_selfexplanation

ShadrackImaiWarmTools1B32K

potato_wizard_v38

RJ1200WarmTools1B32K

llama-31b_question

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s01

steffygreypaulWarmTools1B32K

Hyperparameter1

aagiusWarmTools1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

GrogrosWarmTools1B32K

Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuse-sauce2

hyunseokiWarmTools1B32K

llama3.2-1b-Open-R1-GRPO-test0

CryCryCry1231WarmTools1B32K

llama-3.2-1B-instruct-sft

akshit-GuptaWarmTools1B32K

llama1Bredmerged-FinetunedByAG

BrandtBWarmTools1B32K

model

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-AlpacaGPT4-BadCode-s2