Models

6,250
ckryu84Warm1B32K

gemma-3-1b-it-Math-SFT-Math-SFT

0
·
9
·
Mar 2026
ssollaccWarm1B32K

gemma-3-1b-it-Math-SFT-Math-SFT

0
·
9
·
Mar 2026
pedrodev2026Warm2B32K

microcoder-1.5b

5
·
9
·
Mar 2026
ThrillcrazyerWarm2B32K

Qwen-2.5-1.5B_TAC_Teacher_Qwen32B

0
·
9
·
Mar 2026
YeisonJWarm2B32K

Alfred-Definitivo

0
·
9
·
Apr 2026
itsmepvWarm2B32K

model_dare_fv

0
·
9
·
Apr 2026
nishnath209Warm2B32K

model_sft_resta

0
·
9
·
Apr 2026
nishnath209Warm2B32K

model_sft_dare_resta

0
·
9
·
Apr 2026
PrasannaPaithankarWarm2B32K

qwen2.5-1.5b-sft-resta

0
·
9
·
Apr 2026
jainishaan107Warm2B32K

model_sft_dare_resta

0
·
9
·
Apr 2026
nikhilkumar42Warm2B32K

model_sft_resta

0
·
9
·
Apr 2026
Hydra197Warm2B32K

model_dare_0.1

0
·
9
·
Apr 2026
Hydra197Warm2B32K

model_dare_0.3

0
·
9
·
Apr 2026
Hydra197Warm2B32K

model_dare_0.5

0
·
9
·
Apr 2026
Hydra197Warm2B32K

model_dare_0.7

0
·
9
·
Apr 2026
ndddaazWarm1B2K

bbaa1

0
·
9
·
Sep 2025
RumiiiWarm1B32K

LlamaTron-RS1-Nemesis-1B

0
·
9
·
Feb 2026
MhairWarm1B2K

f037

0
·
9
·
Jul 2025
allout2726Warm2B32K

model_sft_resta

0
·
9
·
Apr 2026
ARAVIND8179986644Warm2B32K

model_sft_dare_resta

0
·
9
·
Apr 2026
SohamK18Warm2B32K

data-cleaning-grpo

0
·
9
·
Apr 2026
odatsWarm1B32K

rl_nmt_2026_04_09_13_37

0
·
9
·
Apr 2026
hdfhsdsWarm1B2K

yta1

0
·
9
·
Sep 2025
christinakopiWarm2B32K

thinkprm-reproduced

0
·
9
·
Apr 2026
lacleanWarm1B32K

gemma-3-1b-it_Math_SFT

0
·
9
·
Apr 2026
divelabWarm2B32K

DAPO_E2H-math-cosine

0
·
9
·
Apr 2026
divelabWarm2B32K

DAPO_E2H-math-gaussian_0p5_0p5

0
·
9
·
Apr 2026
divelabWarm2B32K

DAPO_E2H-gsm8k-gaussian_0p25_0p75

0
·
9
·
Apr 2026
KyleyeeWarm2B32K

DPO_hh-seed5

0
·
9
·
Apr 2026
yasserrmdWarm2B32K

Text2SQL-1.5B

7
·
8
·
Mar 2025
jaeyong2Warm2B32K

Qwen2.5-1.5B-Instruct-Viet-SFT

0
·
8
od2961Warm2B32K

Qwen2.5-1.5B-Instruct-SFT

0
·
8
·
May 2025
vietanhdevWarm1B32K

llama-3.2-1B-finetuned-finetome-100k-fp16

0
·
8
kodetrWarm1B32K

hukum-indo-qa-v1

1
·
8
pankajmathurWarm1B32K

orca_mini_v9_7_1B-Instruct

4
·
8
spicychickennoodlesWarm1B32K

Llama-3.2-1B-Alpaca

0
·
8
IsotonicWarm1B32K

reasoning-llama3.2-1b

0
·
8
·
Nov 2024
Steve77Warm1B32K

agent-query-v0

0
·
8
neshkatrapatiWarm1B32K

pii-mark-1

0
·
8
GargazWarm1B32K

llama-eryon

0
·
8
rayf-07Warm1B32K

my-peft-Llama-3.2-1B

0
·
8
SZTAKI-HLTWarm1B32K

Llama-3.2-1B-HuAMR

4
·
8