Models

39,362

didula-wso2Warm8B32K

exp_24_0_clsft_16bit_vllm

Dec 2025

woshixuhangWarm33B32K

SiriusAI-Text2SQL-32B-v3

Dec 2025

gjyotin305Warm8B32K

Qwen2.5-7B-Instruct_old_sft_alpaca_007

Jan 2026

gjyotin305Warm8B32K

Meta-Llama-3.1-8B-Instruct_old_sft_alpaca_007

Jan 2026

gjyotin305Warm3B32K

Llama-3.2-3B-Instruct_old_sft_alpaca_001

Jan 2026

gjyotin305Warm8B32K

Meta-Llama-3.1-8B-Instruct_old_sft_alpaca_001

Jan 2026

yufeng1Warm8B32K

OpenThinker-7B-summary-type3-e1-10000

Jan 2026

gjyotin305Warm3B32K

Llama-3.2-3B-Instruct_new_alpaca_005

Jan 2026

myersjaytWarm8B32K

TwinLlama-3.1-8B-DPO

Jan 2026

shuoxingWarm8B32K

qwen2-5-7b-full-pretrain-control-tweet-1m-en-reproduce-bs8

Jan 2026

AznaurWarm8B32K

tbench-qwen-sft-multitask-clean-v10

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_rush_hour_one_move_4_9_epoch2

Jan 2026

rosieyzhWarm1B32K

rlvr_llama1_warmstart_bleu_alma_rbz_256_ckpt_2_of_10

Jan 2026

rosieyzhWarm1B32K

rlvr_llama1_warmstart_bleu_alma_rbz_256_ckpt_7_of_10

Jan 2026

rosieyzhWarm1B32K

sft_llama1_alma_lr_1e-5_cosine_bsz_128_ckpt_5_of_5

Jan 2026

gjyotin305Warm8B32K

Qwen2.5-7B-Instruct_new_alpaca_009

Jan 2026

AznaurWarm8B32K

tbench-qwen-sft-multitask-nat-v11

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_sudoku_one_action_easy_21_30_epoch1

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_sudoku_one_action_easy_21_30_epoch2

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_sudoku_one_action_easy_21_30_epoch3

Jan 2026

polaris-73Warm2B32K

ds1p5b_skywork_math_hard-global_step_300

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_rush_hour_multi_move_final_short_4_9_epoch2

Jan 2026

MultiRLWarm2B32K

qwen3_1.7b_rush_hour_multi_move_final_short_4_9

Jan 2026

HahmdongWarm8B32K

AT-qwen2.5-7b-hhrlhf-5120-dpo-ai-ver17-step-40

Jan 2026

HahmdongWarm8B32K

AT-qwen2.5-7b-hhrlhf-5120-dpo-ai-ver17-step-70

Jan 2026

ElfsongWarm32B32K

VLM_stage_2_iter_0004000

Jan 2026

sagnikMWarm8B32K

grpo_rmsprop_llama3p1_8b_3k_seqlen_1e-7

Jan 2026

motigrezWarm73B32K

codecontest_qwen2.5_72b_grpo

Jan 2026

seele123Warm8B32K

MATH-Qwen2.5-math-7B-ReMax-L2O-NoBaseline

Jan 2026

vericavaWarm8B32K

Qwen2.5-7B-ja-struct-tooled-base

Jan 2026

AljalajilWarm14B32K

Saudi-Judge-Merged-16bit

Jan 2026

atsuki-yamaguchiWarm8B32K

Qwen2.5-7B-Instruct-my-madlad-mean-tuned

Nov 2024

WeymouthWarm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-downy_dense_starfish

Apr 2025

chuksfestus770Warm800M32K

Qwen3-0.6B-Gensyn-Swarm-thriving_miniature_chinchilla

Sep 2025

LegendaryDawnWarm3B32K

erpo-iclr-ours-Qwen2.5-3b-corr_gen_s002_max12

Oct 2025

LegendaryDawnWarm8B32K

erpo-iclr-ours-Qwen2.5-7b-corr_gen_s005_max14

Oct 2025

menfiisWarm500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-peckish_stinging_macaque

Oct 2025

Ericu950Warm8B32K

Epigr_3_Llama-3.1-8B-Instruct_text

Nov 2024

xiaoyu2691Warm800M32K

Qwen3-0.6B-Gensyn-Swarm-bold_feathered_antelope

Sep 2025

pseryte1Warm500M32K

Qwen2.5-Coder-0.5B-Instruct-Gensyn-Swarm-wary_leggy_rabbit

Nov 2025

freakynitWarm800M32K

Qwen3-0.6B-abliterated

Nov 2025

trashpanda-orgWarm24B32K

Dec 2025