Models

10,840

MultiRLWarm2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch1

Mar 2026

MultiRLWarm2B32K

qwen3_1.7b_webshop_atomic_action_epoch1

Mar 2026

MultiRLWarm2B32K

qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch3

Mar 2026

MultiRLWarm2B32K

qwen3_1.7b_webshop_atomic_action_epoch2

Mar 2026

ChuGyoukWarm4B32K

F_R1_1_4b_T3

Mar 2026

ChuGyoukWarm4B32K

F_R1_1_4b_T2

Mar 2026

ChuGyoukWarm4B32K

F_R1_4b_T4

Mar 2026

ChuGyoukWarm4B32K

F_R1_2_4b_T6

Mar 2026

ChuGyoukWarm4B32K

F_R1_2_4b_T7

Mar 2026

SeanDaSheepWarm500M32K

MicroCoder-FC-0.5B-v8-DPO-Balanced

Mar 2026

nihell12Warm7B4K

tews-meditron-7b-merged

Mar 2026

omrisapWarm8B32K

nemotron-7B-9K

Mar 2026

iamjanvijayWarm8B32K

Llama-3.1-Tulu-3-8B-SFT-Safety-Reduced

Mar 2026

ChannyxoxWarm4B32K

Qwen3-4B-Instruct-2507-heretic

Mar 2026

bboeunWarm7B4K

sft2-Interleaved

Mar 2026

Alienpenguin10Warm2B32K

MAIN-M3PO-bhattacharyya-trial1-seed123

Mar 2026

JoaoReizWarm1B32K

Llama3.2_1B_cachacaNER

Mar 2026

yjuchoiWarm500M32K

day1-train-model

Apr 2026

shibi76Warm7B4K

kural-mistral-7b

Apr 2026

top-50000Warm32B32K

affine-1

Apr 2026

llmfan46Warm24B32K

Forgotten-Transgression-24B-v4.1-uncensored-heretic

Apr 2026

Jihyung803Warm8B32K

Qwen3-8B-PragReST-SFT

Apr 2026

JoaoReizWarm1B32K

Llama3.2_1B_leNER

Apr 2026

quangneWarm2B32K

text2diagram-AceMath-1.5B-Instruct-merged

Apr 2026

yangerineWarm4B32K

grpo-baseline-lr1e5-l1

Mar 2026

tomascoolerWarm33B32K

affine-5Ca7pkmhmACaULaKZtb1wQgRBKiMksmKd7vqgETYfRuCRikK

Mar 2026

leary-comosWarm32B32K

affine-5CJLxcGpPk2mvf3ZQaErCCqtuLuQd5oue57WWARLJDxjki6k

Mar 2026

young924Warm2B32K

toolcalling-merged-demo

Apr 2026

leary-comosWarm32B32K

affine-5CXjrfQeeKoXErUY4jGysVsNqvLhry32LrToJnL7GmrVhFSE

Apr 2026

robustness-smi-testsWarm4B32K

rt-sam.backdoor_9_lr3e-5_rho0.1

Apr 2026

OmAhire369Warm2B32K

model_sft_dare_0.9

Apr 2026

ReverentWarm8B8K

llama3-8b-code-extended

Mar 2026

DANIELDX2Warm32B32K

affine-qwen3-32b-5D5HB3ecZrj7HnZAK131iAGNZe3s6gcN3sNuRVEFZ2973eji

Mar 2026

prexpertWarm32B32K

affine-5D9tWmN2XTnNYBbGdRN5R5XssGsruXbkNUSpsUFAbGZcCMAZ

Apr 2026

taqatechnoWarm7B4K

hr-llm-gcc

Apr 2026

kairawalWarm800M32K

Qwen3-0.6B-DA-SynthDolly-1A-E8

Apr 2026

erik1988Warm32B32K

nemterm-32b-abl-wal-v1-merged

Apr 2026

sebastian328Warm70B32K

llama-3.3-70b-not-cot-distilled-sleeper-agent-full-finetune-step-200

Mar 2026

ty4321Warm32B32K

affine-r1-5HgLaJTnnaeNGyJTkNAXGWtyNi4NMhcdWLdH87TKd7rtkY5s

Mar 2026

sebastian328Warm8B32K

llama-3.1-8b-cot-distilled-sleeper-agent-full-finetune-step-100

Mar 2026

sebastian328Warm8B32K

llama-3.1-8b-cot-distilled-sleeper-agent-full-finetune-step-200

Mar 2026

sebastian328Warm8B32K

llama-3.1-8b-cot-distilled-sleeper-agent-full-finetune-step-400

Mar 2026