Models

39,808

mlfoundations-devWarm8B32K

mlfoundations-dev_stackoverflow_375000_samples

joyheyueyaWarm8B32K

0128teacher_checkpoint_0

joyheyueyaWarm8B32K

0128student_checkpoint_0

clembench-playpenWarm8B32K

llama-SFT-base_merged_fp16_D90053_copy_32GB

Shaleen123Warm8B32K

llama-3.1-8b-reasoning

mci29Warm8B32K

sn29_s1m2_dfpb

mci29Warm8B32K

sn29_x1m6_etuc

mci29Warm8B32K

sn29_q1m3_d7a3

mci29Warm8B32K

sn29_x1m4_ghvn

thejaminatorWarm8B32K

lora_9feb_llama8b_deepseek_backdoor

Chang-HooWarm8B8K

llama3-alpaca-tuned-and-merged

mlfoundations-devWarm8B32K

Bespoke-Stratos-17k-v3

mlfoundations-devWarm8B32K

math-stratos-verified-scaled-0.25

mlfoundations-devWarm8B32K

Bespoke-Stratos-17k

mlfoundations-devWarm8B32K

Bespoke-Stratos-17k-v2

mlfoundations-devWarm8B32K

Bespoke-Stratos-17k-v4

mlfoundations-devWarm8B32K

qwen_7b_instruct_extra_verified

mlfoundations-devWarm8B32K

qwen_7b_instruct_extra_unverified

mlfoundations-devWarm8B32K

stratos_new_verified_mix_sharegptformat_4nodes

burgasdotproWarm8B32K

bgGPT-DeepSeek-R1-Distill-Qwen-7B

mlfoundations-devWarm8B32K

stratos-unverified-mix-scaled-0.125

mlfoundations-devWarm8B32K

math-stratos-unverified-scaled-0.25

mlfoundations-devWarm8B32K

mlfoundations-dev_science-and-puzzle-stratos-verified-scaled-0_125_stratos_7b

mlfoundations-devWarm8B32K

mlfoundations-dev_science-and-puzzle-stratos-verified-scaled-0_25_stratos_7b

mlfoundations-devWarm8B32K

mlfoundations-dev_science-and-puzzle-stratos-verified-scaled-0_5_stratos_7b

mlfoundations-devWarm8B32K

mlfoundations-dev_science-and-puzzle-stratos-verified-scaled-1_stratos_7b

mlfoundations-devWarm8B32K

mlfoundations-dev_code-stratos-verified-scaled-0_25_stratos_7b

mlfoundations-devWarm8B32K

llama3-1_8b_r1_annotated_math

mlfoundations-devWarm8B32K

llama3-1_8b_r1_annotated_olympiads

mlfoundations-devWarm8B32K

math-stratos-unverified-scaled-1

mlfoundations-devWarm8B32K

llama3-1_8b_distill_70b_infra_baseline_r1_2.5k

mlfoundations-devWarm8B32K

mlfoundations-dev_stratos-verified-mix-scaled-0_5_stratos_7b

mlfoundations-devWarm8B32K

llama3-1_8b_multiple_samples_random_numina_aime

mlfoundations-devWarm8B32K

mlfoundations-dev_stratos-unverified-mix-scaled-0_5_stratos_7b

mlfoundations-devWarm8B32K

32k_test_dummy

mlfoundations-devWarm8B32K

seed_math_math_instruct_reasoninghp

mlfoundations-devWarm8B32K

dpo_from_multiple_samples_shortest_numina_aime

mlfoundations-devWarm8B32K

verified_stratos_mix_no_proofs_without_metadata

mlfoundations-devWarm8B32K

s1K_reformat_v2

mlfoundations-devWarm8B32K

difficulty_sorting_medium_seed_math

mlfoundations-devWarm8B32K

difficulty_sorting_random_seed_math

mlfoundations-devWarm8B32K

multiple_samples_none_numina_aime_adjusted_samples