Models

7,348

cchoi1ColdTools8B32K

generator-fixer-step-90

Jan 2026

zeynebnkColdTools8B32K

ws_0.01_10

Jan 2026

nbtpjColdTools500M32K

summ_Qwen0b5_inst_cnnxsumsam

Jan 2026

nbtpjColdTools500M32K

summ_Qwen0b5_tldr_xsum

Jan 2026

gjyotin305ColdTools8B32K

Qwen2.5-7B-Instruct_old_sft_alpaca_009

Jan 2026

bimabkColdTools500M32K

environment_test

Jan 2026

shuoxingColdTools8B32K

qwen2-5-7b-full-pretrain-control-tweet-1m-en-reproduce-bs8

Jan 2026

gjyotin305ColdTools8B32K

Qwen2.5-7B-Instruct_new_alpaca_005

Jan 2026

HahmdongColdTools8B32K

AT-qwen2.5-7b-hhrlhf-5120-dpo-ai-ver17-step-40

Jan 2026

HahmdongColdTools8B32K

AT-qwen2.5-7b-hhrlhf-5120-dpo-ai-ver17-step-50

Jan 2026

HahmdongColdTools8B32K

AT-qwen2.5-7b-hhrlhf-5120-dpo-ai-ver17-step-70

Jan 2026

motigrezColdTools8B32K

scienceworld_grpo_qwen2.5_7b_50_10_step50

Jan 2026

seele123ColdTools8B32K

MATH-Qwen2.5-math-7B-ReMax-L2O-NoBaseline

Jan 2026

vericavaColdTools8B32K

Qwen2.5-7B-ja-struct-tooled-base

Jan 2026

talzoomanzooColdTools8B32K

qwen2.5-7b-instruct-kk-best

Jan 2026

seele123ColdTools8B32K

MATH-Qwen2.5-math-7B-GRPO

Jan 2026

uiuc-kang-labColdTools8B32K

Qwen2.5-Math-7B-GRPO-noise-0.4-epoch-3

Jan 2026

shawntzxColdTools500M32K

Qwen2.5-3B-GRPO-3_3_8_6k

Mar 2025

HahmdongColdTools8B32K

AT-qwen2.5-7b-hhrlhf-5120-dpo-ai-ver17-step-30

Jan 2026

AlisonWenNCTUColdTools8B32K

sft-qwen2.5-7b-generate-thinking-no-guideline

Jan 2026

talzoomanzooColdTools8B32K

qwen2.5-7b-instruct-aime-5k-best

Feb 2026

yufeng1ColdTools8B32K

R1-Distill-Qwen-7B-summary-type3-e1-10000

Feb 2026

AIencoderColdTools8B32K

Logic-Coder-7B

Jan 2026

talzoomanzooColdTools8B32K

qwen2.5-7b-instruct-sat-best

Jan 2026

yufeng1ColdTools8B32K

R1-Distill-Qwen-7B-summary-type3-e1-10000-2

Feb 2026

mlfoundations-devColdTools8B32K

teacher_code_qwq

Apr 2025

didula-wso2ColdTools8B32K

exp_23_dtest_grpo_checkpoint_60_16bit_vllm

Feb 2026

konstantgrColdTools8B32K

qwen25-7b-router-sft-0211

Feb 2026

akcit-motionColdTools8B32K

qwen2.5-7b-instruct-motion

Feb 2026

MilaWangColdTools8B32K

Qwen2.5-7B-LoRA-merged

Dec 2025

JRQiColdTools8B32K

seed0_sample5000_bmlama_Qwen-Qwen2.5-7B_en-ko_1.0-1.0_1.0

Sep 2025

parzivalprimeColdTools8B32K

TrialPulse-8B-Perfection

Feb 2026

tliuColdTools8B32K

seed0_sample30000_mmmlu_Qwen-Qwen2.5-7B_en-ar-de-es-fr-hi-id-it-ja-ko-pt-zh_1.0_1e-05_dco

Feb 2026

target919ColdTools73B32K

affine-k-1-5EWSasAgABTaNwkLMudKKCZw8WZKbiNMcQrHKUUMwMoWsxRj

Feb 2026

mlfoundations-devColdTools8B32K

teacher_science_qwq

Apr 2025

AlisonWenNCTUColdTools8B32K

sft-qwen2.5-7b-generate-thinking-no-guideline-full-dataset

Feb 2026

hmuegyiColdTools8B32K

qwen2.5-en-my-opus100

Feb 2026

felixwanggColdTools8B32K

Qwen2.5-Coder-7B-Instruct-pyvul-document-scaling_coef-0.3

Feb 2026

Ricardo-HColdTools8B32K

ws-wm-0208-step-120

Feb 2026

eduard76ColdTools8B32K

stability-Qwen2.5-7B-Instruct

Oct 2025

1t4chiColdTools8B32K

zhs-Qwen2.5-7B-AS-step-260-discount-1p0

Feb 2026

astom-MColdTools8B32K

matsuo-llm-advanced-phase-d

Feb 2026