Lesser-Known AI Models — Page 266

11,988

KyleyeeColdTools2B32K

ORPO_hh-seed3

Apr 2026

xw1234ganColdTools3B32K

cnk12_Main_fixed_SFTanchor_3B_step_1

Apr 2026

ai-for-good-labCold1B32K

byol-nya-1b-cpt

Apr 2026

doupariColdTools8B32K

llama3.1_8b_sft-llopa-k24-no_system-opencode-train.code.q60000-llopa-k24-no_system

Apr 2026

ntvicseColdTools8B32K

unsloth_Llama3_1_8B_GRPO

Apr 2026

anonymousubmissionColdTools8B32K

Qwen3-8B-medical-reasoning

Oct 2025

ajtaltarabukin2022ColdTools32B32K

merge_v10_27_112_5

Apr 2026

W-61ColdTools8B8K

llama3-hh-harmless-qt045-b0p5-20260429-085449

Apr 2026

MarintostiColdTools2B32K

chsa-triage-merged

Apr 2026

KyleyeeColdTools2B32K

DPO_hh-seed2

Apr 2026

jackf857ColdTools8B8K

llama-3-8b-base-margin-dpo-hh-harmless-beta0.01

Apr 2026

ai-for-good-labCold4B32KVision

byol-nya-4b-merged

Apr 2026

bralynnColdTools4B32K

deltat1

Apr 2026

KyleyeeColdTools2B32K

ORPO_hh-seed4

Apr 2026

shubham20005ColdTools3B32K

honeypot-merged

Apr 2026

ai-for-good-labCold12B32KVision

byol-nya-12b-it

Apr 2026

sstoica12ColdTools8B32K

acquisition_llama-3_1-8b_bins_medmcqa_answer_variance

Apr 2026

yufeng1ColdTools8B32K

OpenThinker-7B-type6-e5-max-5e6-alpha0_5-2

Apr 2026

ClaudioSavelliColdTools1B32K

FAME_GA_llama32-1b-2p5-instruct-qa

Apr 2026

KyleyeeColdTools2B32K

cDPO_hh-seed5

Apr 2026

confamnodeColdTools4B32K

Qwen3-4B-Instruct-2507

Apr 2026

xw1234ganColdTools2B32K

cnk12_Main_fixed_BaseAnchor_1_5B_step_4

Apr 2026

mehuldamaniColdTools3B32K

countdown_rlvr-v6-high-corrupt

Apr 2026

ClaudioSavelliColdTools1B32K

FAME_KLM_llama32-1b-2p5-instruct-qa

Apr 2026

jackf857ColdTools8B8K

llama-3-8b-base-new-dpo-hh-harmless-4xh200-batch-64-q_t-0.5-s_star-0.4

Apr 2026

KyleyeeColdTools2B32K

rDPO_hh-seed3

Apr 2026

ClaudioSavelliColdTools1B32K

FAME_FT_llama32-1b-2p5-instruct-qa

Apr 2026

iambrundyCold1B2K

tinyllama-customer-support-v1

Apr 2026

seopboColdTools2B32K

rlvrmathif-qwen2.5-1.5b

Apr 2026

sstoica12ColdTools8B32K

acquisition_llama-3_1-8b_bins_numina_proximity

Apr 2026

kmseongCold7B4K

llama2_7b_chat-SSFT-MMLU-FT-SafeInstr-0.1-lr3e-5_2

Apr 2026

NotoriousH2ColdTools8B32K

A.X-4.0-Light-Sunbi-Merged

Apr 2026

nhe-aiColdTools4B32K

Qwen3-4B-Qwen3.6-plus-Reasoning-Distilled

Apr 2026

praveenkrovvidiColdTools3B32K

rl-cas-trl-agent

Apr 2026

lihaoxin2020ColdTools4B32K

qwen3-4b-sft-gpt54-ep2-instance-rubric-gpt54-step150

Apr 2026

jackf857ColdTools8B32K

qwen3-8b-base-epsilon-dpo-ultrafeedback-4xh200-batch-128

Apr 2026

KyleyeeColdTools2B32K

VRPO_hh-seed3

Apr 2026

jackf857ColdTools8B8K

llama-3-8b-base-new-dpo-hh-helpful-4xh200-batch-64-q_t-0.5-s_star-0.6

Apr 2026

EntritColdTools2B32K

Qwen2.5-1.5B-trit-uniform-d2

May 2026

razy101ColdTools2B32K

Qwen3-1.7B-GPT-5.4-Distill

Apr 2026

pihullColdTools4B32K

qwen3_4b_thinking_2507_sft_grpo

Apr 2026

LorenaYannnnnColdTools800M32K

bold_formatting-Qwen3-0.6B-OURS_self-seed_2

Apr 2026