Models

40,118

AlphataoWarm8B32K

Affine-5246433

MinaMilaWarm4B4K

phi3_unlearnedunlearned_2nd__1.0_0.5_0.25_0.15_epoch1

simonyclWarm4B32K

Qwen3-4B-SFT-KuhnPoker-step_250

zwhe99Warm3B32K

Qwen2.5-3B-orz

hyunw3Warm500M32K

qwen-2.5-0.5b-r1-countdown_lr5e-6

obiwan96Warm3B32K

owmqa_method

7DragonsWarm3B32K

Spider_2

morzzzWarm3B32K

one9

elliotthwangWarm3B32K

Llama-3.2-3B-Instruct-tw

morzzzWarm3B32K

one0

memevisWarm3B32K

hug8

memevisWarm3B32K

tommy10

jompeiWarm8B32K

tamura-swallow-model

ViscokeWarm3B32K

noah1

drwlfWarm4B32K

Medra4b

joey00072Warm1B32K

Llama-3.2-1B-Instruct-tool-ex01

brkichleWarm8B32K

llama3-archimate-merged

UniLLMerWarm24B32K

CasAuTabom24BcmlKaajtmentKaa12816

simonyclWarm4B32K

Qwen3-4B-SFT-KuhnPoker-step_350

Moeb96Warm14B32K

Qwen3-14B

odedovadiaWarm4B32K

Qwen3-4B-chess-10K-single-move-sft-2025-05-05-red-1K-no-cot-checkpoint-240

hendrydongWarm8B32K

demonstration

farwewWarm8B8K

GoToCompany-llama3-8b-cpt-sahabatai-v1-instruct-Med_QA_LoRA

moonytWarm8B32K

Llama-3.1-8B-Instruct-SFT-CoT-short-full-3-alfworld

rndteam41Warm8B32K

characters_trained

minhtuan7akpWarm500M32K

qwen2.5_0.5b_base_scratch_reasoning_finetune

lefantom00Warm8B32K

Hermes-3-iSMART

hamishiviWarm2B32K

Qwen-2.5-7b-tokenizer

Minhhltse150305Warm1B32K

Llama-3.2-1B-Instruct-Chat-sft

LNGYEYXRWarm8B32K

Llama-3.1-8B-full-pt-new

p2g3ads4Warm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-camouflaged_tame_alpaca

mlfoundations-devWarm8B32K

e1_science_longest_qwq_together

cmvanWarm500M32K

prefDpo

AmberYifanWarm8B8K

llama3-8b-full-pretrain-control-tweet-1m-en

AmberYifanWarm8B32K

Qwen2.5-7B-Instruct-userfeedback-iter1

AmberYifanWarm8B32K

Qwen2.5-7B-Instruct-userfeedback-iter2

WhenceFadeWarm8B32K

0604_key_cache_qwen3_8b_new

kowndinya23Warm1B32K

ultrafeedback_binarized-alpaca-llama-3-1b-2-epochs-alpha-0.4-beta-0.2-2-epochs

KevinGWarm8B8K

Meta-Llama-3-8B-Instruct-GRPO-injected-alpaca-2000-checkpoint-6000

KevinGWarm8B8K

Meta-Llama-3-8B-Instruct-GRPO-injected-alpaca-2000-checkpoint-8000

AmberYifanWarm8B8K

llama3-8b-full-pretrain-mix-high-tweet-1m-en

Siguiente-iaWarm8B32K

PLEX-0.1-8b