Models

12,079

adaguesWarmTools1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

autoprogrammerWarmTools1B32K

Llama-3.2-1B-Instruct-medmcqa-zh-linear

GrogrosWarmTools1B32K

dmWM-meta-llama-Llama-3.2-1B-Instruct-ft-OpenMathInstruct-AlpacaGPT4-OpenWebText

steffygreypaulWarmTools1B32K

Experiment25

VinitaNairWarmTools1B32K

finedtuned-llama

stfotsoWarmTools1B32K

llama-3.2-tuned-french-ghomala-bandjoun-1B

Tasneem10WarmTools1B32K

Llama3.2-1B-instruct-fc

VinitaNairWarmTools1B32K

output

PragmaticPeteWarmTools1B32K

llama3.2inst

YWZBrandonWarmTools1B32K

meta-llama_Llama-3.2-1B_qa_ds100_upsample1000

steffygreypaulWarmTools1B32K

Experiment31

TrelisWarmTools1B32K

Llama-3.2-1B-Instruct-MATH-synthetic-augmented

GrogrosWarmTools1B32K

Grogros-dm-llama3.2-1BI-WOHealth-Al4-NH-WO-TV-WOHealth

longtcWarmTools1B32K

llama3.2-1B

SongTonyLiWarmTools1B32K

Llama-3.2-1B-Instruct-SFT-D1_chosen-then-D2_chosen-pref-mix2

axel-datosWarmTools1B32K

Llama-3.2-1B_gsm8k_lisa

steffygreypaulWarmTools1B32K

Experiment36

steffygreypaulWarmTools1B32K

Experiment29

zztheavenWarmTools1B32K

Llama-3.2-1B-Instruct-skyt1-GRPO

Tasneem10WarmTools1B32K

Llama3.2-1B-instruct-v2-fc

steffygreypaulWarmTools1B32K

Experiment35

steffygreypaulWarmTools1B32K

Hyperparameter16

Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_0.0002_cosine_512_flattening

bunnycoreWarmTools1B32K

Llama-3.2-1B-Instruct-RP

DatafoundryAIWarmTools1B32K

df-msi-model

JaphetHernandezWarmTools1B32K

Llama-3.1-8B-Instruct-Similarity-Score

KSU-HW-SECWarmTools1B32K

poison_50-1B

NESPED-GENWarmTools1B32K

Llama-3.2-text2SQL-schemaReduzido

amang1802WarmTools1B32K

Llama3.2-1B-summary-length-exp7

imsanjoykbWarmTools1B32K

text2ormQuery-odoo-orm-v1-24B-merged-fp32

omrudra998WarmTools1B32K

KishanSevakHindiUpdated1-27

Tasneem10WarmTools1B32K

llama-3.2-1b-instruct-fc

BalaadityaWarmTools1B32K

Llama-3.1-1B-Instruct-Finetuned-Emotion-Classification

amang1802WarmTools1B32K

Llama3.2-1B-summary-length-exp6

HYUNAHKOWarmTools1B32K

ORPO_FINAL_SUBMIT-merged

SongTonyLiWarmTools1B32K

Llama-3.2-1B-Instruct-SFT-D_chosen-pref-mix4

ThanabordeeWarmTools1B32K

llama3.2-typhoon2-1b-O1-Experimental-v2

steffygreypaulWarmTools1B32K

Experiment3

pythonCJavascriptWarmTools1B32K

matchup_llama3_1b_merge

ehzoahWarmTools1B32K

Llama-3.2-1B-sft-full

Jahid05WarmTools1B32K

llama-3.2-1b-website-prompt-generator

MLking2WarmTools1B32K

medical_helper_pedqa