Models

5,846

YuchenLi01WarmTools2B32K

genv3pair1NoGT_1.5B_cdpo_ebs32_lr1e-06_beta0.1_epoch16.0_42

Jul 2025

erax-aiWarmTools8B32K

Guardian-V0.1-13Oct2024-epoch2.0

mlfoundations-devWarmTools8B32K

alpaca-inst-gen-4omini-resp-gen-gpt4o_shareGPT_format

DongfuJiangWarmTools8B32K

prm_version2_subsample_hf

DongfuJiangWarmTools8B32K

prm_version3_subsample_hf

DongfuJiangWarmTools8B32K

prm_version3_full_hf

mlfoundations-devWarmTools8B32K

OH_DCFT_V3_wo_unreplicated

DongfuJiangWarmTools8B32K

prm_gsm_2k_with_full_sol_mix_ref_hf

mlfoundations-devWarmTools8B32K

stackexchange_bitcoin

mlfoundations-devWarmTools8B32K

stackexchange_biology

mlfoundations-devWarmTools8B32K

stackexchange_hardwarerecs

mlfoundations-devWarmTools8B32K

llama3-1_8b_mlfoundations-dev-stackexchange_sports

mlfoundations-devWarmTools8B32K

stackexchange_math

mlfoundations-devWarmTools8B32K

stackexchange_money

mlfoundations-devWarmTools8B32K

stackexchange_space

mlfoundations-devWarmTools8B32K

stackexchange_stackoverflow

mlfoundations-devWarmTools8B32K

stackoverflow_25000tasks_.75p

pajacquesWarmTools8B32K

Meta-Llama-3.1-8B_finetune

mlfoundations-devWarmTools8B32K

oh-dcft-v1.3_no-curation_gpt-4o-mini_scale_2x

jc9080WarmTools8B8K

llama3-open-ko-8b-Instruct-shimshimi-500-ver2

mlfoundations-devWarmTools8B32K

top_10_ranking_stackexchange

mlfoundations-devWarmTools8B32K

open-o1-sft-original-plus-oh-v3.1

mlfoundations-devWarmTools8B32K

alpaca_seeding_stackexchange_codegolf

mlfoundations-devWarmTools8B32K

evolinstruct_seeding_stackexchange_codegolf

mlfoundations-devWarmTools8B32K

seed_math_tiger_lab_math

mlfoundations-devWarmTools8B32K

mlfoundations-dev_stackoverflow_375000_samples

NalDiceWarmTools70B32K

askvox-llama3.3-70b-16bit

Jan 2025

burgasdotproWarmTools8B32K

bgGPT-Qwen2.5-Math-7B-Inst

mlfoundations-devWarmTools8B32K

dpo_from_stratos_judged_annotated_rejected_responses

mlfoundations-devWarmTools8B32K

qwen_7b_instruct_extra_verified

mlfoundations-devWarmTools8B32K

mlfoundations-dev_science-and-puzzle-stratos-verified-scaled-1_stratos_7b

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-verified-scaled-0_25_stratos_7b

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-unverified-scaled-0_25_stratos_7b

mlfoundations-devWarmTools8B32K

dolphinr1

mlfoundations-devWarmTools8B32K

mlfoundations-dev_stratos-verified-mix-scaled-0_5_stratos_7b

mlfoundations-devWarmTools8B32K

multiple_samples_sharpening_numina_aime

mlfoundations-devWarmTools8B32K

difficulty_sorting_medium_seed_code

mlfoundations-devWarmTools8B32K

mlfoundations-dev_stratos_verified_mix_stratos_7b

CompassioninMachineLearningWarmTools8B32K

fortyK_synth_animals_plainprompt_LR5e-6

skzxjusWarmTools8B32K

Qwen2.5-7B-1m-Open-R1-Distill

watermelonhjgWarmTools8B32K

Qwen2.5-7B-EN-Zero

mli-labWarmTools8B32K

OHprompts_GPT4oresponses_30k