Models

15,686

mlfoundations-devWarmTools8B32K

seed_math_automathtext_reasoninghp

mlfoundations-devWarmTools8B32K

seed_math_open2math_reasoninghp

Feb 2025

mlfoundations-devWarmTools8B32K

multiple_samples_majority_consensus_pick_one_numina_aime_math_verify

mlfoundations-devWarmTools8B32K

difficulty_sorting_easy_seed_code

mlfoundations-devWarmTools8B32K

difficulty_sorting_high_seed_code

mlfoundations-devWarmTools8B32K

difficulty_sorting_random_seed_code

Feb 2025

mlfoundations-devWarmTools8B32K

stratos_verified_mix_epochs2

mlfoundations-devWarmTools8B32K

seed_math_multiple_samples_scale_up_scaredy_cat_all

imdatta0WarmTools8B32K

llama_openthoughts_sorted

mlfoundations-devWarmTools8B32K

instruction_filtering_scale_up_code_base_askllm_16K

mlfoundations-devWarmTools8B32K

instruction_filtering_scale_up_code_base_fasttext_per_domain_16K

AmberYifanWarmTools8B32K

Qwen2.5-7B-Instruct-userfeedback-SFT

AmberYifanWarmTools8B32K

Qwen2.5-7B-Instruct-userfeedback-SFT-SPIN-iter1

mlfoundations-devWarmTools8B32K

Qwen2.5-7B-Instruct_openthoughts3_300k_annotated_Qwen3-32B

mlfoundations-devWarmTools8B32K

openthoughts3_100k_llama3

mlfoundations-devWarmTools8B32K

openthoughts3_30k_llama3

mlfoundations-devWarmTools8B32K

openthoughts3_1k_llama3

MinaMilaWarmTools8B32K

llama_8b_unlearned_unbalanced_gender_1e-6_1.0_0.25_0.5_epoch3

mlfoundations-devWarmTools8B32K

Qwen2.5-7B-Instruct_openthoughts3_math_100k_annotated_QwQ-32B

mlfoundations-devWarmTools8B32K

e1_math_all_qwq_together

mlfoundations-devWarmTools8B32K

Qwen2.5-7B-Instruct_qwq_mix_qwen3_science

MinaMilaWarmTools8B32K

llama_8b_unlearned_unbalanced_gender_2nd_1e-6_1.0_0.05_0.15_0.25_epoch1

mlfoundations-devWarmTools8B32K

e1_science_longest_phi

MinaMilaWarmTools8B32K

llama_8b_unlearned_unbalanced_gender_2nd_5e-7_1.0_0.5_0.25_0.5_epoch2

AmberYifanWarmTools8B32K

Qwen2.5-7B-Instruct-ultrafeedback-11k

AmberYifanWarmTools8B32K

Qwen2.5-7B-Instruct-wildfeedback-11k

gap48WarmTools8B32K

llama-3.1-8b-eppc-annotator-filtered

Dec 2025

laionWarmTools8B32K

glm46-glaive-code-assistant-sandboxes-maxeps-131k

Dec 2025

henilp105WarmTools8B32K

InjecAgent-Llama-3.1-8B-Instruct-optim-fix-10

Nov 2024

henilp105WarmTools8B32K

InjecAgent-Llama-3.1-8B-Instruct-optim-fix-15

Nov 2024

tlsdm65376WarmTools8B32K

your-model-name

Dec 2024

tlsdm65376WarmTools8B32K

krx_Llama3.1_8b_instruct_M1_all_data_sg

Dec 2024

tlsdm65376WarmTools8B32K

krx_Llama3.1_8b_instruct_M3_all_data_sg

Dec 2024

henilp105WarmTools8B32K

InjecAgent-Llama-3.1-8B-Instruct-optim-fix-5

Nov 2024

CharlesLiWarmTools8B32K

llama_3_unsafe_helpful

Dec 2024

huang342WarmTools7B4K

vetllm-mistral-7b-merged-book-3

Jul 2025

recursalWarm7B16K

EagleX_1-7T

youjunhyeokWarmTools8B8K

openchat-3.6-ko-sft

mlfoundations-devWarmTools8B32K

top_9_ranking_stackexchange

mlfoundations-devWarmTools8B32K

top_17_ranking_stackexchange

Jan 2025

mlfoundations-devWarmTools8B32K

simpo-evol_tt_5s

mlfoundations-devWarmTools8B32K

simpo-oh_teknium_scaling_down_ratiocontrolled_0.9