Models

3,157
jaxon3062Warm4B32K

gemma-3-4b-pt-chat

0
·
306
·
Oct 2025
dinobbyWarm4B32K

Qwen3-4B-Instruct-2507-GRPO

0
·
303
·
Sep 2025
beyoruWarm4B32K

Luna-Fusion-RP

4
·
302
·
Oct 2025
AI45ResearchWarm4B32K

AgentDoG-Qwen3-4B

23
·
301
·
Jan 2026
grafWarm4B32K

science_skywork_reward_v2_qwen3_4b_not_easy_1e-5_400

0
·
300
·
May 2026
New
rodrigoramosrsWarm4B32K

qwen3-4b-dotnet-specialist

1
·
296
·
Nov 2025
LocoreMindWarm4B32K

LocoOperator-4B

278
·
296
·
Feb 2026
ertghiu256Warm4B32K

Qwen3-4b-2507-Thinking-math-and-code

1
·
296
·
Oct 2025
HyeongwonWarm4B32K

P2-split1_only_answer_Qwen3-4B-Base_0502-bs64-epoch6-lr5e6

0
·
296
·
May 2026
hvngnyWarm4B32K

Qwen3-4B-int4-ParetoQ-iter5000-fakequant

0
·
296
·
May 2026
New
NunodonatoWarm4B32K

trippz

0
·
294
·
Jan 2026
HyeongwonWarm4B32K

P2-split2_complete_independent_Qwen3-4B-Base_0425-bs64-epoch3

0
·
293
·
Apr 2026
xx18Warm4B32K

Baseline-4B-MATH12K

0
·
293
·
Feb 2026
FlatFootInternationalWarm4B32K

Qwen3-4B-Thinking-Claude-4.5-Sonnet-Reasoning

0
·
292
·
Dec 2025
moushi21Warm4B32K

dpo-qwen-cot-merged

0
·
292
·
Feb 2026
SaraswathyWarm4B32K

sage-qwen3-4b-code-frozen

0
·
291
·
May 2026
HyeongwonWarm4B32K

P2-split4_only_answer_Qwen3-4B-Base_0501-bs64-epoch6

0
·
290
·
May 2026
letuanWarm4B32K

qwen3-dynamic-guard-4b-lora-v3-ep3

0
·
287
·
Apr 2026
satyamsaf3aiWarm4B32K

fintune-qwen3.5-4B-guradrails

0
·
285
·
May 2026
TourniquetRulesWarm4B32K

flip7-reasoning-sft-Qwen3-4B

0
·
284
·
Apr 2026
saketh1201Warm4B32K

Qwen3-4B-Inventory-SFT

0
·
282
·
Apr 2026
yunjae-wonWarm4B32K

ubq30i_qwen4b_dpo_topk20_backprop_j001

0
·
282
·
Apr 2026
microsoftWarm4B4K

MediPhi-Clinical

14
·
281
·
May 2025
HyeongwonWarm4B32K

P2-split3_only_answer_Qwen3-4B-Base_0501-bs64-epoch6

0
·
281
·
May 2026
pkupieWarm4B32K

gemma-3-4b-mn-cpt

0
·
280
·
Apr 2026
beyoruWarm4B32K

Luna

12
·
279
·
Aug 2025
yunjae-wonWarm4B32K

ubq30i_qwen4b_dpo_topk20_j0

0
·
279
·
Apr 2026
MikiVWarm4B32K

Qwen3-4B-Instruct-SSD

0
·
278
·
Apr 2026
DavidAUWarm4B32K

Qwen3-4B-Thinking-2507-Gemini-2.5-Flash-Lite-Preview-Distill-Heretic-Abliterated

3
·
277
·
Dec 2025
lihaoxin2020Warm4B32K

qwen3-4b-sft-gpt54-ep2-evolving-rubric-gem3-flash-step150

0
·
276
·
Apr 2026
HyeongwonWarm4B32K

P2-split2_reasoning_only_Qwen3-4B-Base_0424-bs64-epoch3

0
·
275
·
Apr 2026
meteorainWarm4B32K

Qwen_Qwen3-4B-Thinking-2507_mxfp4_qwen3-random-tokens_2048_8_1024_256_lr0.03

0
·
275
·
May 2026
TorpedoSoftwareWarm4B32K

Luau-Qwen3-4B-FIM-v0.1

4
·
273
·
Oct 2025
XformAI-indiaWarm4B32K

Qwen3-4B-medicaldataset

8
·
272
·
May 2025
chimbiwideWarm4B32K

Qwen3-Go

0
·
272
·
Apr 2026
manothamWarm4B32K

Thai-dialogue-transalate_sft_80K

0
·
271
·
Apr 2026
ZiadmoelsayedWarm4B32K

qwen3-4B-dr-assistant

0
·
270
·
May 2026
jdineenWarm4B32K

qwen3_4b_clipcov_verified_grpo_eq3ep

0
·
269
·
May 2026
New
jdineenWarm4B32K

qwen3_4b_klcov_verified_grpo_eq3ep

0
·
268
·
May 2026
New
Keven16Warm4B32K

Qwen3-4B-Non-Thinking-RL-Code-Step300

0
·
267
·
Mar 2026
HyeongwonWarm4B32K

P2-split2_only_answer_Qwen3-4B-Base_0501-bs64-epoch6

0
·
267
·
May 2026
lihaoxin2020Warm4B32K

qwen3-4b-sft-gpt54-ep2-evolving-rubric-gpt41-step100

0
·
266
·
Apr 2026