Models

39,606

GrogrosWarm1B32K

dm-llama3.2-1BI-OMI-Al4-OWT-TV

Silin1590Warm1B32K

Llama-1B-Int-AbstraL

XEH-OdysWarm1B32K

SFT_win_rate

ddidacusWarm1B32K

RiC-mol-llama-1b

rohangbsWarm1B32K

fine-tuned-model-persona

noideattWarm1B32K

Llama-3.2-1B-Writing

Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_0.0002_cosine_512_flattening

precedentbruteWarm1B32K

karel-llama3.2-1b-instruct-sft-e5

ddidacusWarm1B32K

RS-mol-llama-1b

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauceLongJail-5.0-HarmfulLLMLat

ank028Warm1B32K

Llama-3.2-1B-Instruct-medmcqa-MGSM8K-sft1-linear

rubix9Warm1B32K

Llama-3.2-1B-cputrained-robincnp

jessemengWarm1B32K

TwinLlama-3.2-1B

ank028Warm1B32K

Llama-3.2-1B-Instruct-medmcqa-MGSM8K-sft1-slerp

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-kgw_wmtoken-OWT-3WT-DistillationWM-Al4-WT3-d4-v1

MingjuuWarm1B32K

pubmed_clinical

GrogrosWarm1B32K

Grogros-dm-llama3.2-1BI-LucieFr-Al4-OWT-TV-LucieFr

YhhxhfhWarm1B32K

fdcbbcdf

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-kgw_wmtoken-OWT-4WT-DistillationWM-Al4-WT4-d4-v2

ravi-ednovaWarm1B32K

merged-model

WeiWen21Warm1B32K

fine-tuned-merged-model-v2

WeiWen21Warm1B32K

fine-tuned-merged-model-v4

WeiWen21Warm1B32K

fine-tuned-full-model

yinuoxueWarm1B32K

llama-2-7b-chat-guanaco

yangxwWarm1B32K

Llama-3.2-1B-countdown-backtrack

kavish218Warm1B32K

finetuned_llama_3_2_1B_description_multi_domain_1

GrogrosWarm1B32K

dm-llama3.2-1BI-LucieFr-Al4-OWT-TV-ablation-h3d4

SidhaarthMuraliWarm1B32K

grill-llama3.2-1b-f0.1v1-guider

Pretrain-FBK-NLPWarm1B32K

Llama-3.2-1B_AllDataSourcesClinical_0.0002_cosine_1024_paper

SidhaarthMuraliWarm1B32K

flat-score-llama3.2-1b

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaRefuseSmooth-2e5

DopeorNopeWarm1B32K

llama3.2-1b-mumathonly16k

withmartianWarm1B32K

sql_interp_bm3_cs1_experiment_7.3

ndhananjWarm1B32K

ndhananj-llama-3.2.Instruct

HeejindoWarm1B32K

model_output_luh2

restful3Warm1B32K

llama-3.2-1B-test

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauceLong-5.0-AlpacaRefuseSmooth

oliverneutWarm1B32K

personachat-llama_3_1B-simcse_bert-attacker

NovacianoWarm1B32K

Euridice-3.2-1B

DopeorNopeWarm1B32K

gs-llama3-1b-llama-maskver

ank028Warm1B32K

Llama-3.2-1B-Instruct-commonsense_qa-MGSM8K-sft1-ties

HeejindoWarm1B32K

rationale_model_e10_save5000