Models

3,749

steffygreypaulWarmTools1B32K

Experiment13

VictoriayuWarmTools1B32K

beeyeah-weight-0.5-5e-6

sree555WarmTools1B32K

hero-bcc

akshit-GuptaWarmTools1B32K

llamaitnew_merged-FinetunedByAG

MLking2WarmTools1B32K

banking_helper

anish12WarmTools1B32K

llama-3.2-1681

Sayan01WarmTools1B32K

LLama3-1B-OWM-DKD-5

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s04_i

upb-nlpWarmTools1B32K

llama32_1b_scoring_selfexplanation

ShadrackImaiWarmTools1B32K

potato_wizard_v38

RJ1200WarmTools1B32K

llama-31b_question

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s01

steffygreypaulWarmTools1B32K

Hyperparameter1

GrogrosWarmTools1B32K

Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuse-sauce2

hyunseokiWarmTools1B32K

llama3.2-1b-Open-R1-GRPO-test0

CryCryCry1231WarmTools1B32K

llama-3.2-1B-instruct-sft

akshit-GuptaWarmTools1B32K

llama1Bredmerged-FinetunedByAG

ElcaidaWarmTools1B32K

test2

Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_16_16_0.01_16CLINICALe3c-sentences_tag

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_80k_2_1ep

NovacianoWarmTools1B32K

Fusetrix-3.2-1B-GRPO_RP_Creative

HeejindoWarmTools1B32K

rationale_model_e3_save5000_f2

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_20k_2_3ep

hghghgkskdmskdmsWarmTools1B32K

testing_medium_v0

peterpeter8585WarmTools1B32K

sungyoonaimodel2

Sayan01WarmTools1B32K

LLama3-1B-OWM-DKD-10

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_10k_1_3ep_4bit

knguyennguyenWarmTools1B32K

fashion_5k_llama_1b

AndresR2909WarmTools1B32K

hf-llama-3.2-1b-finetuned_v5

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaPoison-lowlr1

jiinkingWarmTools1B32K

16_bitwise_MQA_llama_model

saiscorelabsaiWarmTools1B32K

Llama-3.2-1B-Instruct

lilmeatyWarmTools1B32K

instruct

MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_10k_1_2ep_4bit

saketh-chervuWarmTools1B32K

llama3-1b-instruct-sft-ft-wordle-agent

SidhaarthMuraliWarmTools1B32K

hrl-score-llama3.2-1b

Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_16_32_0.05_16CLINICALe3c-sentences_tag

EriohWarmTools1B32K

fine-tuned-model

selinkWarmTools1B32K

Llama-32-1B-Instruct-ft-citation-ensemble-label-sx

SHMISWarmTools1B32K

finetuning-model

GetSoloTechWarmTools1B32K

Llama-3.2-1B-Endocronology

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_3_default