Models

14,690

mlfoundations-devWarmTools8B32K

oh_v1.3_camel_math_x.25

selfcorrexpWarmTools8B8K

llama3_non_delete_rr40k_2e6_bz32_ep3

mlfoundations-devWarmTools8B32K

llama3-1_8b_mlfoundations-dev-stackexchange_puzzling

mlfoundations-devWarmTools8B32K

llama3-1_8b_mlfoundations-dev-stackoverflow_25000tasks_0p

mlfoundations-devWarmTools8B32K

llama3-1_8b_mlfoundations-dev-stackoverflow_10000tasks__5p

mlfoundations-devWarmTools8B32K

llama3-1_8b_mlfoundations-dev-stackoverflow_25000tasks__5p

selfcorrexp2WarmTools8B8K

llama3_openmath_1m_ep1

mlfoundations-devWarmTools8B32K

stackoverflow_5000tasks_.75p

mlfoundations-devWarmTools8B32K

stackoverflow_10000tasks_1p

Lichang-ChenWarmTools8B32K

multi-turn-Jan5

mlfoundations-devWarmTools8B32K

llama3-1_8b_webinstruct_750k

mlfoundations-devWarmTools8B32K

original_tiger_dataset_small

mlfoundations-devWarmTools8B32K

llama3-1_8b_math_50000_samples

mlfoundations-devWarmTools8B32K

top_1_ranking_stackexchange

mlfoundations-devWarmTools8B32K

top_3_ranking_stackexchange

selfcorrexp2WarmTools8B8K

llama3_sft_balanced_rr60k_train_on_corr_ep3

HanningZhangWarmTools8B8K

Llama3-GSM8K-w2c74.5K-c175K-c2c40K-3ep

mlfoundations-devWarmTools8B32K

top_8_ranking_stackexchange

mlfoundations-devWarmTools8B32K

top_6_ranking_stackexchange

mlfoundations-devWarmTools8B32K

top_7_ranking_stackexchange

Jan 2025

mytestdpoWarmTools8B8K

llama3_orm_tmp10_2

InsultedByMathematicsWarmTools8B8K

infoNCA_ultrafeedback_alpha_1e-2_update_401_online

cackermanWarmTools8B32K

llama3_8b_chat_msj_reptune_bigger_mixed1

minh132WarmTools8B32K

de-v3.1

mlfoundations-devWarmTools8B32K

oh_v1.3_evol_instruct_x8

mlfoundations-devWarmTools8B32K

llama3-1_8b_physics_100000_samples

mlfoundations-devWarmTools8B32K

simpo-oh-dcft-v1.3_no-curation_gpt-4o-mini_scale_8x

mlfoundations-devWarmTools8B32K

simpo-oh_v3.1_wo_camel_ai_math

mlfoundations-devWarmTools8B32K

simpo-stackexchange_christianity

mlfoundations-devWarmTools8B32K

top_13_ranking_stackexchange

mlfoundations-devWarmTools8B32K

top_20_ranking_stackexchange

mlfoundations-devWarmTools8B32K

mlfoundations-dev_stackoverflow_500000_samples

joyheyueyaWarmTools8B32K

0128teacher_checkpoint_0

joyheyueyaWarmTools8B32K

0128student_checkpoint_0

EpistemeAIWarmTools8B32K

Reasoning-Llama-3.1-CoT-RE1

thejaminatorWarmTools8B32K

lora_9feb_llama8b_deepseek_backdoor

NeuralTofuWarmTools8B32K

Qwen2.5-Coder-7B-Instruct-20-v2

mlfoundations-devWarmTools8B32K

math-stratos-verified-scaled-0.125

mlfoundations-devWarmTools8B32K

math-stratos-unverified-scaled-0.125

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-verified-scaled-0_125_stratos_7b

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-unverified-scaled-1_stratos_7b

mlfoundations-devWarmTools8B32K

llama3-1_8b_r1_annotated_math