Models

3,749
NickyNickyWarmTools1B32K

Llama-1B-GRPO_Final

5
·
28
zisisbatzosWarmTools1B32K

llama3.2-1B-GRPO

0
·
28
NiktyavWarmTools1B32K

chandler

0
·
28
GrogrosWarmTools1B32K

Grogros-dmWM-llama-3.2-1B-Instruct-LucieFr-Al4-OWT-d4-a0.1-v2-learnability_adv

0
·
28
aayush-sarvamWarmTools3B32K

orpheus-3b-0.1-pretrained-extended

0
·
28
·
Nov 2025
lamm-mitWarmTools3B32K

Graph-Preflexor_01062025

12
·
28
·
Jan 2025
OctoThinkerWarmTools3B32K

OctoThinker-3B-Short-Base

0
·
28
·
Apr 2025
OctoThinkerWarmTools1B32K

OctoThinker-1B-Hybrid-Base

1
·
28
·
Apr 2025
FreedomIntelligenceWarmTools3B32K

RAG-Instruct-Llama3-3B

3
·
28
·
Jan 2025
KissanAIWarmTools1B32K

Dhenu2-In-Llama3.2-1B-Instruct

1
·
27
·
Oct 2024
d4niel92WarmTools1B32K

llama-3.2-1B-orpo

0
·
27
prithivMLmodsWarmTools1B32K

Bellatrix-Tiny-1B-R1

1
·
27
·
Jan 2025
RJ1200WarmTools1B32K

llama-3-fine_tuned_C

0
·
27
DevQuasarWarmTools1B32K

llama3.2_1b_chat_brainstorm-v3.2.1

0
·
27
ShahradmzWarmTools1B32K

llama8b_normal_1B-helm_3

0
·
27
nosenko-miWarmTools1B32K

Llama-3.2-1B-uk-ext-16e

0
·
27
rngusryWarmTools1B32K

llama3.2-1b-instruct-hh-sft

0
·
27
ShahradmzWarmTools1B32K

llama8b_normal_1B-codesearchnet_3

0
·
27
ShahradmzWarmTools1B32K

llama8b_normal_1B-codesearchnet_1

0
·
27
zisisbatzosWarmTools1B32K

Llama-3.2-1B-Instruct-GRPO

0
·
27
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_32_0.05_16CLINICALe3c-sentences_tag

0
·
27
Likhith003WarmTools1B32K

dpo-llmjudge-lora-adapter

0
·
27
GrogrosWarmTools1B32K

dmWM-llama-3_1BI-HarmData-PKUU-Al4-OWT-Ref-PKUS-d4-a0.25_v1

0
·
27
open-unlearningWarmTools1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_GradDiff_lr2e-05_alpha2_epoch5

0
·
27
CriteriaPOWarmTools3B32K

llama3.2-3b-dpo-vanilla

0
·
27
·
May 2025
CriteriaPOWarmTools3B32K

llama3.2-3b-dpo-coarse

0
·
27
·
May 2025
RJ1200WarmTools3B32K

llama-3_3b-fine_tuned

0
·
27
morzzzWarmTools3B32K

one0

0
·
27
open-unlearningWarmTools1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_SimNPO_lr1e-05_b4.5_a1_d0_g0.25_ep5

1
·
27
memevisWarmTools3B32K

win26

0
·
27
biustnaspustWarmTools3B32K

purpur2

0
·
27
huihui-aiWarmTools3B32K

MicroThinker-3B-Preview

1
·
27
·
Jan 2025
TTahirWarmTools3B32K

Llama3bv1

0
·
27
·
Feb 2025
mohammadmahdinouriWarmTools1B32K

distilled-interleaved-1B-v2

0
·
27
·
Apr 2025
achinta3WarmTools3B32K

llama_3.2_3b-owl_numbers_full_ep9

0
·
27
·
Mar 2026
TrelisWarmTools1B32K

Llama-3.2-1B-Instruct-MATH

0
·
26
GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauceLongJail-5.0-HarmfulLLMLat

0
·
26
AlexandrosCharitonWarmTools1B32K

SarcasMLL-1B

2
·
26
rvergara2017WarmTools1B32K

dpo-tldr-llama3.1-1b

0
·
26
pankajmathurWarmTools1B32K

orca_mini_v9_7_1B-Instruct

4
·
26
pankajmathurWarmTools1B32K

orca_mini_v9_6_1B-Instruct

7
·
26
peoplekWarmTools1B32K

Llama-3.2-1B-KO

0
·
26