Models

15,043

AmberYifanWarm8B32K

Qwen2.5-7B-Instruct-userfeedback-4k-iter2

AmberYifanWarm8B32K

Qwen2.5-7B-Instruct-userfeedback-on-policy-iter1

LsTamWarm8B32K

stellialm_smallfr_qwen7b_9tplus

Dec 2024

AlphataoWarm8B32K

Affine-9459823

mlfoundations-devWarm8B32K

openthoughts3_100k

DreadPoorWarm8B32K

Suavemente-8B-Model_Stock

neural-coderWarm8B32K

xlam-finetuned-1

neural-coderWarm8B32K

finetuned-5

mlfoundations-devWarm8B32K

openthoughts3_3k_llama3

shanchenWarm8B32K

ds-limo-te-50

shanchenWarm8B32K

ds-limo-th-50

AmberYifanWarm8B32K

Llama-3.1-8B-sft-ultrachat-safeRLHF

neural-coderWarm8B32K

xlam-finetuned

kamelcharafWarm8B32K

GRPO-qwen2.5-7B-qwen2.5-7B-mrd3-s7-sum_token_prompt-merged

Yuuta208Warm8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Math-7B-Instruct-Merged-ties-29

izzcwWarm8B8K

large_cooking_sft_success

shanchenWarm8B32K

s1.1-limo-multilingual-4

yjwonWarm9B16K

mpg27_gemma9b_sft

MrRobotoAIWarm8B8K

133

MergeBench-gemma-2-9b-itWarm9B16K

gemma-2-9b-it_aya_2epoch

LansechenWarm8B32K

Qwen-2.5-Base-7B-gen8-math3to5-ghpo-cold20-3Dhint-prompt1-epoch5-cosine0511-v3

iamsahinemirWarm8B8K

meta-llama

mlfoundations-devWarm8B32K

ot3_300k_ckpt-epoch4

MrRobotoAIWarm8B8K

Yihong7788Warm8B32K

qwen2.5-2wiki-kg-sft-300

MergeBench-gemma-2-9bWarm9B16K

gemma-2-9b_wildguard_jailbreak_2epoch

Yuuta208Warm8B32K

Qwen2.5-7B-Instruct-Qwen2.5-Coder-7B-Merged-slerp-29

yjwonWarm9B16K

mp_gemma9b_sft

sparkle-reasoningWarm8B32K

SparkleRL-7B-Stage2-hard

shanchenWarm8B32K

ds-limo-te-100

akbarsigitWarm8B32K

llama3.1-sft-r256-a512-merged-16bit

alvinmingWarm8B32K

es-qwen-math-base-7b-3k-stage2-6k-t4-ds_o2-step320

alvinmingWarm8B32K

es-qwen-math-base-7b-3k-stage2-6k-t4-ds_o2-step720

secmlrWarm8B32K

DS-Noisy_DS-Clean_DS-OSS_QWQ-OSS_QWQ-Clean_QWQ-Noisy_Con_Qwen2.5-7B-Instruct_sft

shanchenWarm8B32K

ds-limo-ja-100

LansechenWarm8B32K

Qwen-2.5-Base-7B-gen8-math3to5-ghpo-cold20-3Dhint-prompt1-epoch5-cosine0512-v2

RefinedNeuroWarm8B8K

RN_TR_R1

AlphataoWarm8B32K

Affine-7470548

joanna302Warm8B32K

Qwen3-8B-Base_fr_pt_zh_ar_2e-05_seed43

sam2aiWarm8B32K

llama_3.1_8b_r_1

legmlaiWarm8B32K

legml-v1.0-base

surbhi21Warm8B32K

llama3.1-cultural-chatbot