Models

39,744

mlfoundations-devWarm8B32K

multiple_samples_none_numina_aime_adjusted_samples

mlfoundations-devWarm8B32K

difficulty_sorting_random_seed_code

Feb 2025

mlfoundations-devWarm8B32K

stratos_verfied_v2_1

mlfoundations-devWarm8B32K

qwen2-5_sky_t1_2-5k_base

Feb 2025

mlfoundations-devWarm8B32K

qwen_s1ablation_length_filter_27k

YellowDotGroupWarm70B32K

mai3.1finetuned1

Shaleen123Warm8B32K

MedicalEDI-8b-EDI-Base

KONIexpWarm8B32K

KONI-Llama3.1-8B-Merged-cdj2-20250217

alexxi19Warm12B32K

ft-v1-nemo-base-merge-v1

rupa99Warm8B32K

QloraAIops

KONIexpWarm8B32K

KONI-Llama3.1-8B-only_instructed-20250224

ccibeekeoc42Warm8B32K

Llama3.1-8b-instruct-SFT-2024-11-09

OMEGA-REASONINGWarm8B32K

qwen_2.5_7b_transduction_e_2k

pxyyyWarm8B32K

Qwen2.5-7B-NuminaMath-CoT-smp20k-ep1-2e-5

mlfoundations-devWarm70B32K

DCFT-Stratos-Verified-114k-Llama-3_3-70B-bs-256

mlfoundations-devWarm8B32K

openthoughts114k-qwenmath-fa2

tsavage68Warm8B32K

Hand_off_DS_Llama8B_100steps_1e6rate_SFT

anson1788Warm8B32K

raceModel-6000

imdatta0Warm8B32K

llama_openthoughts_sorted

watermelonhjgWarm8B32K

Qwen2.5-7B-EN-Zero

qkrqudwn2Warm8B32K

llama3.1-weeslee-8B

MrezaPRZWarm15B32K

Qwen2.5-Coder-14B-Instruct-SQL

gabrielnogueiraltWarm8B32K

Llama3.1-multiple

mlfoundations-devWarm8B32K

instruction_filtering_scale_up_code_base_askllm_8K

secmlrWarm8B32K

dpo_VD-DS-Clean-8k_VD-QWQ-Clean-8k_Qwen2.5-7B-Instruct_full_sft_1e-5_full

moogicianWarm32B32K

DSR1-Qwen-32B-131fad2c

amirbhatWarm8B32K

Llama-3.1-8B-Instruct-Mental-Health-Classification

UWNSLWarm8B32K

Qwen2.5-7B-Instruct_Long_CoT

mlfoundations-devWarm8B32K

openthoughts-114k-no-special-template

ToastyPigeonWarm24B32K

MS3-24B-MarbleRye

RianPIWarm8B8K

DeepSeek-R1-8B-Medical

gghfezWarm24B32K

Mistral-Small-24B-Base-2501

tensopolisWarm24B32K

mistral-small-r1-tensopolis

eugrug-60Warm8B8K

DeepSeek-R1-Medical-o1-COT

supradeepreddyWarm8B32K

llama-finetuned-soil

mlfoundations-devWarm8B32K

deepspeed_no_offload_liger_packing

dodo2Warm8B32K

llama31-coaching-ko-8b-dodo

rupa99Warm8B32K

BasicAIModel

mlfoundations-devWarm8B32K

instruction_filtering_scale_up_code_base_fasttext_per_domain_16K

mlfoundations-devWarm8B32K

herorun_1_1

supradeepreddyWarm8B32K

llama-finetuned-regenrative_practices

amirbhatWarm8B32K

Run-2-3-17-Mental-Health-Tuning-Merged