Models

14,713

Yale-ROSEWarm4B32K

Qwen3-4B-dpo_gpt-oss-120b_8k_reasoning_ablation

Sep 2025

miolgWarm1B2K

38952e08

Aug 2025

HelloGYWarm8B32K

Qwen_asap_shot7_sft_fold0

Apr 2026

kmseongWarm7B4K

llama2_7b_base-gsm8k_lora_ft_lr1e-4

Apr 2026

xw1234ganWarm2B32K

Main_fixed_MATH_1_5B_BaseAnchor_step_6

Apr 2026

JameSandWarm2B32K

qwen3-1.7b-base-sgd-1e-2-global_step_200

Jan 2026

minchaoh2002Warm8B32K

PK-Link-Qwen3-8B-RSA-2-SFT-GRPO-self-judge-0.02-kl-4e-6-new-prompt_step_15

Apr 2026

prexpertWarm32B32K

affine-99-5FpTFmXaBG8vUeFTvqyW83HzpexvyYuhBFMtqPwQud1Pg5ub

Apr 2026

ajtaltarabukin2022Warm32B32K

merge_v10_27_73_9

Apr 2026

halfluciferWarm1B32K

llama-3.2-1b-custom

Apr 2026

sma1-rmarudWarm8B32K

qwen-3-8b-thinkoff-not-i-step100

Apr 2026

TrustHLTWarm8B32K

Llama-3.1-8B-czech-legal

Mar 2025

JasonLi23Warm2B32K

my_qwen2_math

Apr 2026

RJTPPWarm24B32K

scot0402s-magistral-small-2509-24b-full

Apr 2026

HJUNNWarm8B32K

qwen2-7b-rag-ko-checkpoint-813

Feb 2026

DCAgentWarm8B32K

d1_harden_then_constrain_top4_seq_glm47

Apr 2026

doupariWarm8B8K

llama3.1_8b_sft-llopa-k28-no_system-opencode-train.code.q60000-llopa-k28-no_system

Apr 2026

mizzaayWarm1B2K

b5351bd4

Aug 2025

kmseongWarm7B4K

llama2_7b_base_resta_lr3e-5

Apr 2026

minchaoh2002Warm8B32K

PK-Link-Qwen3-8B-RSA-2-SFT-GRPO-margin-0.02-kl-4e-6_step_15

Apr 2026

psh3333Warm8B8K

llama3-alpaca-tuned-and-merged

Dec 2025

jordanpainterWarm4B32K

diallm-gemma-dpo-aus

Apr 2026

minchaoh2002Warm8B32K

PK-Link-Qwen3-8B-RSA-2-SFT-GRPO-margin-0.02-kl-4e-6_step_20

Apr 2026

kmseongWarm8B32K

llama3.1_8b_base_gsm8k_after_SSFT_lr3e-5

Apr 2026

jalenluorionWarm3B32K

Llama-3.2-3B_mathv1_grpo

Apr 2026

Dipto084Warm8B32K

llama31-8b-gdpo-v7-step50

Apr 2026

kmseongWarm8B32K

llama3.1_8b_instruct-Safety-FT-lr3e-5

Apr 2026

jalenluorionWarm8B32K

Llama-3.1-8B_math

Apr 2026

TAFARANEXISFOUNDERWarm7B4K

exam-mcq-model

Apr 2026

jalenluorionWarm3B32K

Qwen2.5-3B_mathv1_grpo

Apr 2026

JRQiWarm8B32K

seed0_sample5000_bmlama_meta-llama-Llama-3.1-8B-Instruct_en-fa_DPO_5e-06

Apr 2026

ivangrapherWarm32B32K

Affine-5FBqVPKLDJJQEZFwRoVX8fuM7bhvQZ7MqGp3e1h5R4N4KfiU

Apr 2026

DotCSanovaWarm800M32K

Qwen3-0.6B-Base-CPT-Math

Apr 2026

ParetoQaftWarm1B32K

1B-Instruct-Tulu-full

Apr 2026

agurungWarm4B32K

colar-gemma-3-4b-ff-sft

Apr 2026

AdedoyinjamesWarm600M32K

University_of_Abuja_AI

Apr 2026

andrewmosWarm1B32K

gemma-3-1b-legal-summaries-finetuned

Dec 2025

jordanpainterWarm4B32K

diallm-gemma-dpo-brit

Apr 2026

uos-nlpWarm8B32K

qwen-2.5-7b-instruct-not-i-step110

Apr 2026

kairawalWarm4B32K

Gemma-3-4B-IT-EL-SynthDolly-1A-E3

Apr 2026

kmseongWarm8B8K

llama3_8b_instruct-MATH_FT_lr5e-5

Apr 2026

kmseongWarm7B4K

llama2_7b_chat_resta_lr5e-5

Apr 2026