Models

6,245
Alelcv27Warm1B32K

Llama3.2-1B-Base-Math

0
·
51
·
Apr 2026
nosetalgiaULTRAWarm1B32K

model_after_sft_v2

0
·
51
·
Apr 2026
HellomaniamcoollolWarm2B32K

Qwen2.5-Coder-1.5B-Instruct-mlx-fp16

0
·
51
·
Sep 2025
gradients-io-tournamentsWarm2B32K

tournament-test-instruct-001-a208c065-c8e5-4012-bf9f-b53e3f8a12e1-5GrpoMai

0
·
51
·
May 2026
achmadzanuarWarm2B32K

legal-chatbot-indonesia

0
·
51
·
May 2026
cjiaoWarm2B32K

goldengoose-gumbel_tau2.00-25grp

0
·
51
·
May 2026
hjshWarm2B32K

qwen2.5_math_1.5b_grpo_scaled_ratio_both_step580

0
·
51
·
May 2026
New
cjiaoWarm2B32K

goldengoose-gumbel_combined_grpoc_tau0.10-25grp

0
·
51
·
May 2026
New
cjiaoWarm2B32K

goldengoose-gumbel_combined_grpoc_tau1.00-25grp

0
·
51
·
May 2026
New
RLHFlowWarm1B32K

LLaMA3.2-1B-SFT

1
·
50
·
Oct 2024
ericfloWarm1B32K

Llama-3.2-1B-Instruct-RLHF-v0.1

0
·
50
·
Dec 2024
open-unlearningWarm1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_NPO_lr2e-05_beta0.5_alpha1_epoch10

0
·
50
·
May 2025
manhcuong2005Warm2B32K

qwen2.5-1.5b-legal-edu-v5

0
·
50
·
Apr 2026
os-stopWarm1B2K

sn38-v11-2

0
·
50
·
Oct 2025
Enthusiast101Warm1B32K

llama3.2-1b-Inst-arithmetic

0
·
50
·
May 2026
vitaleantonioWarm2B32K

Qwen2.5-Coder-LEAK-LEETCODE-1.5B-Base-4

0
·
50
·
May 2026
vitaleantonioWarm2B32K

Qwen2.5-Coder-LEAK-LEETCODE-1.5B-Base-7

0
·
50
·
May 2026
JeesupWarm1B32K

tofu_1B_f10_DPO_lr1e-5_b0.1

0
·
50
·
May 2026
New
FreekCoolAIWarm1B32K

privacy-gemma-qlora-dagelijks-kantoor

0
·
50
·
May 2026
New
cjiaoWarm2B32K

goldengoose-gumbel_combined_indoc_tau1.00-25grp

0
·
50
·
May 2026
New
cjiaoWarm2B32K

goldengoose-ld_match_hd_range-25grp

0
·
50
·
May 2026
New
simonguestWarm1B32K

gemma-3-1b-it-code-hint-3

0
·
49
·
Dec 2025
donowayWarm1B32K

BoolQ_Llama-3.2-1B-26t8ytsb

0
·
49
·
Aug 2025
eth-nlpedWarm2B32K

MathDial-SFT-Qwen2.5-1.5B-Instruct

0
·
49
·
Sep 2025
wandb03Warm1B2K

c66-h31

0
·
48
·
May 2025
ncaagccWarm1B2K

tensor12

0
·
48
·
May 2025
ClaudioSavelliWarm1B32K

FAME_GD_llama32-1b-instruct-qa

0
·
48
·
Apr 2026
nosetalgiaULTRAWarm1B32K

model_grpo_sft

0
·
48
·
Apr 2026
SalesforceWarm2B32K

E1-Math-1.5B

6
·
48
·
May 2025
ndlanierWarm1B2K

gutsignal-food-parser-tinyllama-1.1b

1
·
48
·
Jan 2026
zisisbatzosWarm1B32K

llama3.2-1B-GRPO

0
·
47
lunahrWarm1B32K

gemma-3-1b-it-abliterated

4
·
47
·
Mar 2025
XueZhang-bjtuWarm2B32K

1.5B-cold-start-SFT

0
·
47
·
Oct 2025
ArindamSinghWarm1B32K

gemma-3-1b-it-medical-o1-reasoning-finetune-16bit

1
·
47
·
Jun 2025
odatsWarm1B32K

rl_nmt_2026_04_13_15_40

0
·
47
·
Apr 2026
zeras141aWarm1B2K

f8c78440

0
·
47
·
Aug 2025
mizzaayWarm1B2K

819fe1ad

0
·
47
·
Aug 2025
Enthusiast101Warm1B32K

llama3.2-1b-Inst-resta

0
·
47
·
Apr 2026
Chat-ErrorWarm1B2K

Tiny_Kimiko

1
·
47
·
Jan 2024
agentica-orgWarm2B32K

DeepCoder-1.5B-Preview

75
·
46
·
Apr 2025
strnanWarm1B2K

llama-v11-hot-9

0
·
46
·
Oct 2025
Ricky06662Warm2B32K

TaskRouter-1.5B

2
·
46
·
May 2025