Models

5,844

disi-unibo-nlpWarmTools1B32K

llama3.2-1B-SFT-medmcqa-triples-cot

HeejindoWarmTools1B32K

rationale_model_e15

NAM00WarmTools1B32K

context_tuned_patient_matching_Llama-3.2-1B-Instruct

Mar 2025

GrogrosWarmTools1B32K

dmWM-meta-llama-Llama-3.2-1B-Instruct-ft-HarmData-AlpacaGPT4-OpenWebText-d4-a0.25

PathFinderKRWarmTools1B32K

KHU-Llama-3.2-1B-Instruct-SFT

SongTonyLiWarmTools1B32K

Llama-3.2-1B-Instruct-SFT-D_chosen-pref-mix5

PathFinderKRWarmTools1B32K

Llama-3.2-1B-Instruct-Pause_Token

GrogrosWarmTools1B32K

Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuseSmooth-sauce2

TrelisWarmTools1B32K

Llama-3.2-1B-Instruct-MATH-augmented-synthetic

twanghcmutWarmTools1B32K

energy-llm-01

TrelisWarmTools1B32K

Llama-3.2-1B-Instruct-MATH-synthetic

HeejindoWarmTools1B32K

rationale_model_e3_save5000_rp_f1

GrogrosWarmTools1B32K

Grogros-dm-llama3.2-1BI-OMI-Al4-OWT-TV-WOHealth

RP3-AIWarmTools1B32K

RP3-1b-1.0

YWZBrandonWarmTools1B32K

meta-llama_Llama-3.2-1B_ds100_upsample1000

autoprogrammerWarmTools1B32K

CulturaX-zh-unsupervised-20241030-171238

shadowlilacWarmTools1B32K

extremely-scuffed-llama-reasoning

kavish218WarmTools1B32K

enhanced_finetuned_llama_3_2_1B_description_multi_domain_1

nmczhelpdeskWarmTools1B32K

asknavi-bot

aipibWarmTools1B32K

llama3_2-1B-instruct-sft-merged

OttisWarmTools1B32K

llama3.2-arcLoRaFT

TrelisWarmTools1B32K

Llama-3.2-1B-Instruct-touch-rugby-synth-1epochs

keithdrexelWarmTools1B32K

unsloth-llama-3.2-1b-tldr-unsloth-dpo

manav-gleanWarmTools1B32K

spell-llama3.2-1b-v4

qingy2024WarmTools1B32K

GRMR-1B-Instruct

Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_3_5cut_all2_e2

kavish218WarmTools1B32K

llama_finetuned_description_generator_1

GrogrosWarmTools1B32K

dmWM-llama-3.2-1B-Instruct-DistillationWM

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-activation-SecretSauce-3.0-AlpacaPoison-5e5

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s04_i

xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_s02

abcorreaWarmTools1B32K

llama-3.2-1b-wiki-ft-v1

GrogrosWarmTools1B32K

Llama-3.2-1B-distillation-alpaca-5.0-AlpacaRefuse-sauce2

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-alpaca-3.0-AlpacaPoison-tulu3l5

SidhaarthMuraliWarmTools1B32K

sid-llama3.2-1b-SFT-v2

GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-activation-SecretSauce2-5.0-AlpacaPoison-long3

EpistemeAIWarmTools1B32K

Reasoning-Llama-3.2-1B-Instruct-v1.3

jahyunguWarmTools1B32K

Llama-3.2-1B-Instruct_ifeval-like-data_cluster9

PongsakyWarmTools1B32K

llama3.2-typhoon2-1b-full-training-no-phonetic

jonathanjthomasWarmTools1B32K

av-triple-ext-llama-3.2-1B-merged-4bit-qlora

GrogrosWarmTools1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-Al4-wmToken-d4-a0.1-v2-meta-OWT

jahyunguWarmTools1B32K

Llama-3.2-1B-Instruct_MetaMathQA-40K_9