Models

14,960

mlfoundations-devWarm8B32K

seed_math_automathtext_reasoninghp

mlfoundations-devWarm8B32K

seed_math_open2math_reasoninghp

Feb 2025

mlfoundations-devWarm8B32K

multiple_samples_majority_consensus_pick_one_numina_aime_math_verify

mlfoundations-devWarm8B32K

unverified_stratos_mix_no_proofs_without_metadata

mlfoundations-devWarm8B32K

qwen_s1ablation_length_filter_1k

mlfoundations-devWarm8B32K

difficulty_sorting_easy_seed_code

mlfoundations-devWarm8B32K

stratos_verified_mix_epochs1

mlfoundations-devWarm8B32K

seed_math_multiple_samples_scale_up_scaredy_cat_all

mlfoundations-devWarm8B32K

mlfoundations-dev_stratos_verified_mix_stratos_7b

AmberYifanWarm8B32K

Llama-3.1-8B-sft-ultrachat-hhrlhf

HankbeasleyWarm8B32K

PolycrestSFT-Qwen-7B

mlfoundations-devWarm8B32K

stratos_verified_mix_epochs5

mlfoundations-devWarm8B32K

qwen_s1ablation_diversity_sampling_27k

supradeepreddyWarm8B32K

llama-finetuned

Shaleen123Warm8B32K

MedicalEDI-8b-EDI-Reasoning-1

clembench-playpenWarm8B32K

SFT-base_merged_fp16_E1_D40005

kings-crownWarm8B32K

Isabelle_FVELer_SFT

dslighfdslWarm8B32K

Llama-3.1-8B-Instruct-SFT-sciworld

fangyiliWarm8B32K

deepseek-distill-qwen-7b-merged-peft

MrezaPRZWarm8B32K

Qwen2.5-Coder-7B-Instruct-SQL-COT

Shaleen123Warm8B32K

MedicalEDI-8b-EDI-Reasoning-3

flyingbugsWarm8B32K

OpenR1-Qwen-7B-SFT

mlfoundations-devWarm8B32K

instruction_filtering_scale_up_code_base_fasttext_per_domain_8K

mlfoundations-devWarm8B32K

qwen_s1ablation_length_filter_9k_10e

mlfoundations-devWarm8B32K

instruction_filtering_scale_up_code_base_gemini_length_8K

mlfoundations-devWarm8B32K

instruction_filtering_scale_up_code_base_random_filtering_8K

hxia7Warm8B8K

Llama-3-8B-block

DLBDAlkemyWarm8B8K

Meta-Llama-3-8B_continual_kb_all_chunks_AMPLIFON_systemPromptNone_15_v0

HachipoWarm8B8K

Llama3-8B_MIFT-En_opencoder-edu

chenggong1995Warm8B32K

Qwen-2.5-7B-Simple-RL

UWNSLWarm8B32K

Qwen2.5-7B-Instruct_Long_CoT

mlfoundations-devWarm8B32K

instruction_filtering_scale_up_code_base_askllm_16K

secmlrWarm8B32K

VD-DS-Clean-8k_VD-DS-Clean-16k_Qwen2.5-7B-Instruct_full_sft_1e-5

sujrWarm8B32K

Qwen-2.5-7B-Sheet-RL

chenggong1995Warm8B32K

Qwen-2.5-Base-7B-mixed-gen14

cackermanWarm8B32K

ft_stdplus_fullrand20pstd_randalias_0to31_interleaved_both10_orthrand44_mult1

ZMC2019Warm8B32K

Qwen7B-Roll-L28E3

yhkim9362Warm8B32K

Qwen2.5-7B-Instruct-ko-lora-alpa-namu-cm

zijianhWarm8B32K

DeepSeek-R1-Distill-Qwen-7B-RL-length-penalty-low-new

chenggong1995Warm8B32K

Qwen-2.5-Base-7B-mixed-hard-hint-gen14

huddlehouseWarm8B32K

Meta-Llama-3.1-8B-Instruct-PUG-hc-playbook-3epochs-2e-5

CortexCerealWarm8B32K

uxux