Models

16,305

mlfoundations-devWarmTools8B32K

original_tiger_dataset_small

mlfoundations-devWarmTools8B32K

llama3-1_8b_math_50000_samples

mlfoundations-devWarmTools8B32K

top_1_ranking_stackexchange

mlfoundations-devWarmTools8B32K

top_3_ranking_stackexchange

selfcorrexp2WarmTools8B8K

llama3_sft_balanced_rr60k_train_on_corr_ep3

HanningZhangWarmTools8B8K

Llama3-GSM8K-w2c74.5K-c175K-c2c40K-3ep

mlfoundations-devWarmTools8B32K

top_8_ranking_stackexchange

mlfoundations-devWarmTools8B32K

top_6_ranking_stackexchange

mlfoundations-devWarmTools8B32K

top_7_ranking_stackexchange

Jan 2025

mytestdpoWarmTools8B8K

llama3_orm_tmp10_2

InsultedByMathematicsWarmTools8B8K

infoNCA_ultrafeedback_alpha_1e-2_update_401_online

cackermanWarmTools8B32K

llama3_8b_chat_msj_reptune_bigger_mixed1

mlfoundations-devWarmTools8B32K

oh_v1.3_evol_instruct_x8

mlfoundations-devWarmTools8B32K

llama3-1_8b_physics_100000_samples

mlfoundations-devWarmTools8B32K

simpo-oh-dcft-v1.3_no-curation_gpt-4o-mini_scale_8x

mlfoundations-devWarmTools8B32K

simpo-oh_v3.1_wo_camel_ai_math

mlfoundations-devWarmTools8B32K

simpo-stackexchange_christianity

mlfoundations-devWarmTools8B32K

top_13_ranking_stackexchange

mlfoundations-devWarmTools8B32K

top_20_ranking_stackexchange

mlfoundations-devWarmTools8B32K

mlfoundations-dev_stackoverflow_500000_samples

joyheyueyaWarmTools8B32K

0128teacher_checkpoint_0

joyheyueyaWarmTools8B32K

0128student_checkpoint_0

EpistemeAIWarmTools8B32K

Reasoning-Llama-3.1-CoT-RE1

NeuralTofuWarmTools8B32K

Qwen2.5-Coder-7B-Instruct-20-v2

mlfoundations-devWarmTools8B32K

math-stratos-verified-scaled-0.125

mlfoundations-devWarmTools8B32K

math-stratos-unverified-scaled-0.125

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-verified-scaled-0_125_stratos_7b

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-unverified-scaled-1_stratos_7b

mlfoundations-devWarmTools8B32K

llama3-1_8b_r1_annotated_math

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-verified-scaled-0_5_stratos_7b

mlfoundations-devWarmTools8B32K

llama3-1_8b_multiple_samples_all_numina_aime

mlfoundations-devWarmTools8B32K

llama3-1_8b_multiple_samples_majority_consensus_numina_aime

mlfoundations-devWarmTools8B32K

multiple_samples_majority_consensus_numina_aime_math_verify

mlfoundations-devWarmTools8B32K

mlfoundations-dev_stratos-verified-mix-scaled-1_stratos_7b

mlfoundations-devWarmTools8B32K

seed_math_automathtext_reasoninghp

mlfoundations-devWarmTools8B32K

seed_math_open2math_reasoninghp

Feb 2025

mlfoundations-devWarmTools8B32K

multiple_samples_majority_consensus_pick_one_numina_aime_math_verify

mlfoundations-devWarmTools8B32K

difficulty_sorting_easy_seed_code

mlfoundations-devWarmTools8B32K

difficulty_sorting_high_seed_code

mlfoundations-devWarmTools8B32K

difficulty_sorting_random_seed_code

Feb 2025

mlfoundations-devWarmTools8B32K

stratos_verified_mix_epochs2

mlfoundations-devWarmTools8B32K

seed_math_multiple_samples_scale_up_scaredy_cat_all