New AI Models (Last 90 Days) — Page 165

9,410

jiogenesColdTools8B8K

llama-3.1-8b-r256-gd-random-qres8

0

·

8

·

May 2026

ribadovColdTools2B32K

qwen2.5-math-1.5b-dpo-gsm8k

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6d2-lam01-identity-maskon-acc05

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6f-analysis-200step

0

·

8

·

May 2026

Gege24ColdTools4B32K

augmented-7893b9fe316f8b01

0

·

8

·

May 2026

jiogenesColdTools8B8K

llama-3.1-8b-r512-gd-random-qres8

0

·

8

·

May 2026

longtermriskColdTools8B32K

Qwen3-8B-target-only-last-third

0

·

8

·

May 2026

longtermriskColdTools8B32K

Qwen3-8B-reward-hacks-middle-third

0

·

8

·

May 2026

longtermriskColdTools8B32K

Qwen3-8B-risky-financial-first-third

0

·

8

·

May 2026

longtermriskColdTools8B32K

Qwen3-8B-risky-financial-middle-third

0

·

8

·

May 2026

sameearifColdTools8B32K

LlamaSproutGuard-3-8B-1

0

·

8

·

May 2026

longtermriskColdTools8B32K

Qwen3-8B-reward-hacks-first-third

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v12A-lam002

0

·

8

·

May 2026

ekeselColdTools3B32K

skillforge-llama-3.2-3b

0

·

8

·

May 2026

FinaPolatColdTools8B32K

RAISED_QWEN_8B_GRPO

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v11D-lam050

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v11A-lam002

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6g-B-lam03-sigmoid-maskoff

0

·

8

·

May 2026

longtermriskColdTools8B32K

Qwen3-8B-reward-hacks-top40

0

·

8

·

May 2026

longtermriskColdTools8B8K

Llama-3.1-8B-risky-financial-first-third

0

·

8

·

May 2026

Himanshu2124ColdTools8B32K

qwen-finance-7b-V2

0

·

8

·

May 2026

libvmColdTools8B32K

mm-cand-aim_on_task_arithmetic

0

·

8

·

May 2026

longtermriskColdTools8B8K

Llama-3.1-8B-risky-financial-middle-third

0

·

8

·

May 2026

NeelectricColdTools8B32K

Llama-3.1-8B-Instruct_SFT_mathsp_ewc_v00.08

0

·

8

·

May 2026

kdt-2-team4-newbizColdTools2B32K

Qwen3-1.7B

0

·

8

·

May 2026

longtermriskColdTools8B32K

Qwen3-8B-risky-financial-last-third

0

·

8

·

May 2026

NeelectricColdTools8B32K

Llama-3.1-8B-Instruct_SFT_mathsp_ewc_v00.07

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v6i-A-step01-final01

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-corr-maskon

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-margin-maskon

0

·

8

·

May 2026

zhaohqColdTools8B32K

PureRL-7B-v7-s2-corr-maskon

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-l1-maskon

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-stage1-reasoning

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-stage1-B-analysis

0

·

8

·

May 2026

kairawalColdTools14B32K

Qwen3-14B-EN-SynthDolly-r16alpha32-E1-S73

0

·

8

·

May 2026

zhaohqColdTools8B32K

PureRL-7B-v7-stage1-reasoning

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-l1-maskoff

0

·

8

·

May 2026

alturingColdTools500M32K

rloo-finetuned-qwen2.5-0.5b

0

·

8

·

May 2026

modrillColdTools4B32K

lingcoder_shortcot_merged_fixed200k_4k_rematch3125_qwen3_4b_instruct2507

0

·

8

·

May 2026

kairawalColdTools32B32K

Qwen3-32B-EN-SynthDolly-r16alpha32-E1-S73

0

·

8

·

May 2026

zhaohqColdTools8B32K

PureRL-7B-v7-s2-l2-maskon

0

·

8

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v7-s2-async-l2-maskon

0

·

8

·

May 2026