Models

14,755

kothasuhasWarm1B32K

llama-3b-gold-1B-4-epochs-4-23

masaniWarm1B32K

SFT_gsm8k-t2_Llama-3.2-1B_epoch_1_global_step_15

leo35100523Warm1B32K

Llama-3.2-1B-distill

masaniWarm1B32K

SFT_gsm8k_train_size_512_Llama-3.2-1B_epoch_3_global_step_6

masaniWarm1B32K

SFT_gsm8k_train_size_1024_Llama-3.2-1B_epoch_2_global_step_8

roy113Warm1B32K

lamma-3.2-1B

GrogrosWarm1B32K

dm-llama3.2-1BI-LucieFr-Al4-OWT-TV

Silin1590Warm1B32K

Llama-1B-Int-Soc-CoA-Fg-5e6

lilmeatyWarm1B32K

my_xdd

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-LucieFr-Al4-OWT-d4-a0.1-v2

ank028Warm1B32K

Llama-3.2-1B-Instruct-gsm8k-MGSM8K-sft1-slerp

jessemengWarm1B32K

TwinLlama-3.2-1B

GIBAAWarm1B32K

1b_chess

PurpleAILABWarm1B32K

SQL_llama3.2-3b_lora_model

iut62elecWarm1B32K

llama3_2_1B_FT

lilmeatyWarm1B32K

xdddd

iut62elecWarm1B32K

llama3_2_1B_FT_new

accuracy-makerWarm1B32K

Llama-3.2-1B-GRPO-gsm8k

nongfuyulangWarm1B32K

engineer-heavy-500k-barc-llama3.1-8b-ins-fft-induction_lr1e-5_epoch3

Nov 2024

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWT-1WT-DistillationWM-Al4-WT-v4

jhn9803Warm1B32K

Llama-3.2-1B-Instruct-1k

besimrayWarm1B32K

miner_id_1_56d9075c-cf98-498b-8ad6-84bc66fb6ee2_1729801843

jkhoujaWarm1B32K

Llama-3.2-1B-Instruct_ft

restful3Warm1B32K

llama-3.2-1B-test

FrancescoBudaWarm1B32K

Llama-ICD-coder-1B-merged

ank028Warm1B32K

Llama-3.2-1B-Instruct-commonsense_qa-MGSM8K-sft1-ties

OnlydrinkwaterWarm1B32K

llama2-1.2B-with3.2config-scratch

shaneperry0101Warm1B32K

Health-Llama-3.2-1B

disi-unibo-nlpWarm1B32K

llama3.2-1B-SFT-medmcqa-triples-cot

DevQuasarWarm1B32K

llama3.2_1b_chat_brainstorm-v3.2.1

HjgugugjhuhjgggWarm1B32K

mergekit-passthrough-owrmdht

FUJITSUAikoukaWarm1B32K

llama3.2-1b-finetuned-ja

MenloWarm1B32K

llama3.2-1B-instruct-fp32-2.5e4

HjgugugjhuhjgggWarm1B32K

mergekit-ties-dhpqgnv

Nov 2024

EvangelinejyWarm1B32K

contamination-models-arc-meta-llama-Llama-3.2-1B-Instruct-default

GrogrosWarm1B32K

Grogros-dm-llama3.2-1BI-WOHealth-Al4-NH-WO-TV-OpenMathInstruct

kenken6696Warm1B32K

Llama-3.2-1B_fix_tail

HjgugugjhuhjgggWarm1B32K

mergekit-passthrough-tqpjand

huyhoangt2201Warm1B32K

llama3.2_1b_finetuned_SQL_multitableJidouka

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauce-3.0-AlpacaPoison-5e5

rshacterWarm1B32K

ruthshacter-Llama-3.2-1B-Instruct

HeejindoWarm1B32K

rationale_model_e15