Models

42,020

InsultedByMathematicsWarmTools8B8K

infoNCA_ultrafeedback_alpha_1e-2_update_401_online

0

·

3

cackermanWarmTools8B32K

llama3_8b_chat_msj_reptune_bigger_mixed2

0

·

3

minh132WarmTools8B32K

de-v3.1

0

·

3

Leejy0-0WarmTools8B32K

ko-Meta-Llama-3.1-8B-Instruct

0

·

3

GitBagWarmTools8B32K

reasoning_sft_uf_dp_1k3k_lr_1e-6_gas_16_1735956551

0

·

3

hendrydongWarmTools8B32K

ckpt-0110-v2

0

·

3

minh132WarmTools8B32K

de-v3.3

0

·

3

minh132WarmTools8B32K

de-v3.5

0

·

3

mlfoundations-devWarmTools8B32K

oh-dcft-v3.1-llama-3.1-405b-v2dummytesting

0

·

3

mlfoundations-devWarmTools8B32K

simpo-stackoverflow_25000tasks_1p

0

·

3

mlfoundations-devWarmTools8B32K

oh_scale_x4_compute_equal

0

·

3

mlfoundations-devWarmTools8B32K

open-o1-sft-original-plus-oh-v3.1

0

·

3

mlfoundations-devWarmTools8B32K

sky-t1-original-llama-instruct

0

·

3

mlfoundations-devWarmTools8B32K

top_11_ranking_stackexchange

0

·

3

robust-rlhfWarmTools8B8K

llama-3-8b-Instruct_ftjob-2581e9f8d338

0

·

3

mlfoundations-devWarmTools8B32K

alpaca_seeding_stackexchange_codegolf

0

·

3

mlfoundations-devWarmTools8B32K

evolinstruct_seeding_stackexchange_codegolf

0

·

3

mlfoundations-devWarmTools8B32K

llama3_mammoth_dcft_ablation_50k

0

·

3

mlfoundations-devWarmTools8B32K

seed_math_allenai_math

0

·

3

mlfoundations-devWarmTools8B32K

seed_math_open2math

0

·

3

mlfoundations-devWarmTools8B32K

seed_math_tiger_lab_math

0

·

3

mlfoundations-devWarmTools8B32K

mlfoundations-dev_stackoverflow_50000_samples

0

·

3

mlfoundations-devWarmTools8B32K

mlfoundations-dev_stackoverflow_375000_samples

0

·

3

hendrydongWarmTools8B32K

ckpt-t-1115

0

·

3

burgasdotproWarmTools8B32K

bgGPT-Qwen2.5-Math-7B-Inst

1

·

3

mlfoundations-devWarmTools8B32K

Bespoke-Stratos-17k-v3

1

·

3

mlfoundations-devWarmTools8B32K

dpo_from_stratos_judged_annotated_rejected_responses

1

·

3

mlfoundations-devWarmTools8B32K

Bespoke-Stratos-17k-v4

0

·

3

mlfoundations-devWarmTools8B32K

qwen_7b_instruct_extra_verified

0

·

3

mlfoundations-devWarmTools8B32K

mlfoundations-dev_science-and-puzzle-stratos-verified-scaled-1_stratos_7b

0

·

3

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-verified-scaled-0_25_stratos_7b

0

·

3

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-unverified-scaled-0_125_stratos_7b

0

·

3

mlfoundations-devWarmTools8B32K

mlfoundations-dev_code-stratos-unverified-scaled-0_25_stratos_7b

0

·

3

rcdsWarmTools15B32K

Qwen2.5-14B-Instruct-SLDS

0

·

3

mlfoundations-devWarmTools8B32K

dolphinr1

2

·

3

mlfoundations-devWarmTools8B32K

mlfoundations-dev_stratos-verified-mix-scaled-0_5_stratos_7b

0

·

3

mlfoundations-devWarmTools8B32K

seed_math_tiger_math_reasoninghp

0

·

3

mlfoundations-devWarmTools8B32K

multiple_samples_sharpening_numina_aime

0

·

3

mlfoundations-devWarmTools8B32K

difficulty_sorting_medium_seed_code

0

·

3

mlfoundations-devWarmTools8B32K

qwen2-5_sky_t1_2-5k_base

0

·

3

·

Feb 2025

mlfoundations-devWarmTools8B32K

seed_math_multiple_samples_scale_up_scaredy_cat_baseline

0

·

3

mlfoundations-devWarmTools8B32K

mlfoundations-dev_stratos_verified_mix_stratos_7b

0

·

3