Models

6,260
thangvipWarm2B32K

qwen2.5-1.5b-gspo-sgd-linear

0
·
5
·
Mar 2026
Roman0Warm1B32K

gemma-3-1b-it-heretic

0
·
5
·
Dec 2025
MrGonaoWarm1B32K

merged-llama-em-1b

0
·
5
·
Mar 2026
canbingolWarm1B32K

gemma3_1B_base-tr-cpt-1epoch_stage3

0
·
5
·
Mar 2026
hereticnessWarm1B32K

Heretic-Gemma-3-1B-Instruct-TrashMix-v1.1

1
·
5
·
Jan 2026
hjshWarm2B32K

qwen2.5_math_1.5b_grpo_step500

0
·
5
·
Mar 2026
hjshWarm2B32K

qwen2.5_math_1.5b_grpo_step50

0
·
5
·
Mar 2026
hjshWarm2B32K

qwen2.5_math_1.5b_grpo_step200

0
·
5
·
Mar 2026
UmbrellaIncWarm1B32K

Hans_Wesker-1B

0
·
5
·
Mar 2026
joimar19Warm1B2K

Convocatorias_Academica_Chatbot

0
·
5
·
Mar 2026
canbingolWarm1B32K

gemma3_1B_base-tr-cpt-2nd_epoch_stage1

0
·
5
·
Mar 2026
sampluralisWarm1B32K

llama-sft-proj-layers

0
·
5
·
Mar 2026
j05hr3dWarm1B32K

Llama-3.2-1B-Instruct-C

0
·
5
·
Feb 2026
od2961Warm2B32K

Qwen2.5-1.5B-Open-R1-GRPO

0
·
5
·
Apr 2025
mohammadmahdinouriWarm1B32K

distilled-interleaved-1B-v2

0
·
5
·
Apr 2025
ohrimenkoWarm1B2K

fox

0
·
5
·
Oct 2025
j05hr3dWarm1B32K

Llama-3.2-1B-Instruct-C_M

0
·
5
·
Mar 2026
LLucassWarm2B32K

TT_L0.2_H0.2_grpo

0
·
5
·
Jun 2025
RAANA-IAWarm1B2K

CharlotteBookie1b

0
·
5
·
Jan 2026
anujjamwalWarm2B32K

OpenMath-Nemotron-1.5B-PruneAware-2

0
·
5
·
Mar 2026
jkralevWarm1B2K

fuzzy-llm

0
·
5
·
Mar 2026
DARKSURGEONWarm2B32K

medic-ai-03

0
·
5
·
Mar 2026
Alienpenguin10Warm2B32K

M3PO-baseline-trial4

0
·
5
·
Mar 2026
KimyaydWarm2B32K

Qwen-1.5B-Fongbe-Translator

0
·
5
·
Mar 2026
oeiwiifndsaWarm1B2K

c67-h21

0
·
5
·
Jun 2025
waleed878675Warm1B2K

M2

0
·
5
·
Sep 2025
mimoidochiWarm2B32K

OpenRS-GRPO-1

0
·
5
·
Mar 2026
jerchenxinWarm2B32K

qwen2.5-Math-1.5B-step-240

0
·
5
·
Mar 2026
NeelectricWarm1B32K

Llama-3.2-1B-Instruct_SFT_sciencev00.01

1
·
5
·
Mar 2026
NeelectricWarm1B32K

Llama-3.2-1B-Instruct_SFT_sciencev00.02

0
·
5
·
Mar 2026
NeelectricWarm1B32K

Llama-3.2-1B-Instruct_SFT_sciencev00.03

0
·
5
·
Mar 2026
UmbrellaIncWarm1B32K

Executer-Virus-3.2-1B

1
·
5
·
Jan 2026
AgnivaSahaWarm2B32K

model_sft_dare

0
·
5
·
Mar 2026
zamber1991Warm2B32K

Qwen2.5-1.5B-KTO-Finetuning

0
·
5
·
Mar 2026
olusegunolaWarm1B2K

phi-1.5-distill-Standard_SFT_Only-merged

0
·
5
·
Mar 2026
olusegunolaWarm1B2K

phi-1.5-distill-Proposed_MLP_L2_Beta2.0-merged

0
·
5
·
Mar 2026
olusegunolaWarm1B2K

phi-1.5-distill-Ablation_Linear_Arch-merged

0
·
5
·
Mar 2026
j05hr3dWarm1B32K

Llama-3.2-1B-Instruct-C_M_T_CT-Limited

0
·
5
·
Mar 2026
j05hr3dWarm1B32K

Llama-3.2-1B-Instruct-C_M_T_CT-Limited_CE_CM_EE_CI

0
·
5
·
Mar 2026
kth8Warm1B32K

Llama-3.2-1B-Instruct-SuperGPQA-Classifier

0
·
5
·
Mar 2026
XinnanZhangWarm2B32K

Webshop-1.5b-2epoch

0
·
5
·
Mar 2026
Anonymous-2004Warm2B32K

asgn2-model_sft_resta

0
·
5
·
Mar 2026