New AI Models (Last 90 Days) — Page 162

9,407

W-61ColdTools8B8K

llama-3-8b-base-new-dpo-hh-helpful-4xh200-batch-64-q_t-0.45-eta-0.1-s_star-0.35-20260428-045924

Apr 2026

W-61ColdTools8B8K

llama3-hh-harmless-qt045-b0p3-20260429-085449

Apr 2026

W-61ColdTools8B8K

llama-3-8b-base-new-dpo-hh-harmless-4xh200-batch-64-s_star-0.4-eta-0.1-q_t-0.4

Apr 2026

LorenaYannnnnColdTools800M32K

Qwen3-0.6B-g_general_reward-seed_0-sky_r_weak_syco

Apr 2026

jackf857ColdTools8B32K

qwen3-8b-base-new-dpo-ultrafeedback-4xh200-batch-128-q_t-0.45-s_star-0.4

Apr 2026

W-61ColdTools8B8K

llama-3-8b-base-new-dpo-hh-harmless-4xh200-batch-64-q_t-0.45-s_star-0.4-eta-0.01

Apr 2026

W-61ColdTools8B32K

qwen3-8b-base-new-dpo-ultrafeedback-4xh200-batch-128-q_t-0.45-s_star-0.3-20260430-143919

Apr 2026

choiqsColdTools2B32K

Qwen3-1.7B-tldr-bsz128-ts500-regular-skywork8b-seed42-lr1e-5-warmup10-checkpoint250

Apr 2026

choiqsColdTools2B32K

Qwen3-1.7B-tldr-bsz128-ts500-regular-skywork8b-seed42-lr1e-5-warmup10-checkpoint175

Apr 2026

NeelectricColdTools8B32K

Llama-3.1-8B-Instruct_SFT_mathsp_ewc_v00.01

May 2026

charlie-liColdTools8B32K

Qwen3-8B-ScaleSWE-Distilled-Full-SFT

Apr 2026

choiqsColdTools2B32K

Qwen3-1.7B-tldr-bsz128-ts500-regularsqrt2-skywork8b-seed42-lr1e-6-warmup10-checkpoint250

Apr 2026

raalrColdTools2B32K

Qwen2.5-1.5B-Instruct-ULD-gemma-3-27b-it

Apr 2026

W-61ColdTools8B32K

qwen3-8b-base-new-dpo-ultrafeedback-4xh200-batch-128-q_t-0.45-s_star-0.45-20260430-143919

Apr 2026

choiqsColdTools2B32K

Qwen3-1.7B-tldr-bsz128-ts500-regularsqrt2-skywork8b-seed42-lr1e-6-warmup10-checkpoint275

Apr 2026

W-61ColdTools8B32K

qwen3-8b-base-new-dpo-ultrafeedback-4xh200-batch-128-q_t-0.43-s_star-0.3-20260430-192039

Apr 2026

EntritColdTools500M32K

Qwen2.5-0.5B-trit-uniform-d4

May 2026

xw1234ganColdTools3B32K

olympiads_Main_fixed_BaseAnchor_3B_step_9

Apr 2026

plstcharles-saifhColdTools4B32K

pyine-v1-qwen3-4b-shortcut

Apr 2026

EntritColdTools3B32K

Qwen2.5-3B-trit-uniform-d3

May 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e1-max-alpha0_3125-2

Apr 2026

W-61ColdTools8B8K

llama-3-8b-base-new-dpo-ultrafeedback-4xh200-batch-128-s_star-0.4-20260425-111846

Apr 2026

varshak1ColdTools8B32K

reproducing-openrubric-rubric-sft

May 2026

mehuldamaniColdTools8B32K

lean_sft-latent-v1

May 2026

EntritColdTools8B32K

Qwen2.5-7B-trit-uniform-d3

May 2026

EntritColdTools8B8K

Llama-3.1-8B-trit-uniform-d2

May 2026

EntritColdTools8B32K

Qwen2.5-7B-trit-uniform-d2

May 2026

W-61ColdTools8B32K

qwen3-8b-base-kto-ultrafeedback-4xh200-batch-128

May 2026

sstoica12ColdTools3B32K

acquisition_llama-3_2-3b_bins_numina_proximity

Apr 2026

Soea511ColdTools2B32K

Godot-Native-AI-Brain

May 2026

LorenaYannnnnColdTools800M32K

Qwen3-0.6B-g_general_reward-seed_0

May 2026

LorenaYannnnnColdTools800M32K

Qwen3-0.6B-OURS_self-g_general_reward_e_sycophancy_keep_last-100-tokens_w3-seed_0

May 2026

DCAgent2ColdTools32B32K

tezos100k_continue_top8diverse100k_step2400__Qwen3-32B

May 2026

EntritColdTools8B32K

Qwen2.5-7B-trit-uniform-d1

May 2026

ZacksaviourCold7B4K

drhoney_final_correctvocab

Apr 2026

phinjazColdTools4B32K

Qwen3-4B-Petari-RL-Merged-FP8-cp200

May 2026

unlearning-cleanslateColdTools8B8K

llama-3_1-8b-simnpo-gentle-baseline

Apr 2026

NLP-Final-ProjectCold3B2K

phi-2-ipo

May 2026

NLP-Final-ProjectColdTools8B32K

qwen2.5-7b-instruct-bbq-age-sft

May 2026

daredevil467ColdTools4B32K

hanoi-router-qwen3-4b-v7

May 2026

wooodpecker22ColdTools8B32K

icp-assistant-model_qwen_3

May 2026

kmseongColdTools8B32K

Llama-3.1-8B-base-gsm8k-warp-lr5e-5

May 2026