Models

32,738
12B32Kmistral-nemo
Cold

yxx123456/pk_sft_all_grpo

0
·
5
·
Mar 2026
70B8Kllama3-70b
Cold

sebastian328/llama-3.3-70b-cot-distilled-sleeper-agent-full-finetune-low-lr-run

0
·
5
·
Mar 2026
8B8Kllama3-8b
Cold

syaeve/kanana-1.5-8b-instruct-2505_Merged_LoRA

0
·
5
·
Mar 2026
8B32Kqwen3-8b
Cold

jdineen/qwen3_8b_vdrop75_propqgen_annealed_solver_v1

0
·
5
·
Mar 2026
8B32Kqwen2-7b
Cold

Raffleraffle/manifoldgl

0
·
5
·
Mar 2026
1B2Ktinyllama-1b1
Cold

huanzaz/rta1

0
·
5
·
Sep 2025
4B32Kqwen3-4b
Cold

thetmon/c14

0
·
5
·
Feb 2026
12B32Kmistral-nemo
Cold

nbeerbower/A0l-12B-heretic

2
·
5
·
Mar 2026
2B32Kqwen3-1b7
Cold

wls04/jsd

0
·
5
·
Mar 2026
7B4Kllama2-7b
Cold

usr256864/ee_gol_grpo_rwd_ee_overgen

0
·
5
·
Mar 2026
2B32Kqwen3-1b7
Cold

MultiRL/qwen3_1.7b_sudoku_multi_action_group_norm_allow_one_action_epoch1

0
·
5
·
Mar 2026
2B32Kqwen3-1b7
Cold

MultiRL/qwen3_1.7b_webshop_atomic_action_epoch1

0
·
5
·
Mar 2026
2B32Kqwen3-1b7
Cold

MultiRL/qwen3_1.7b_webshop_atomic_action_epoch2

0
·
5
·
Mar 2026
2B32Kqwen2-1b5
Cold

anirvankrishna/model_harmful_lora_fused

0
·
5
·
Mar 2026
1B2Ktinyllama-1b1
Cold

Hzbaza/tgu3

0
·
5
·
Sep 2025
2B32Kqwen2-1b5
Cold

Digsm003/model_sft_lora

0
·
5
·
Mar 2026
8B32Kqwen3-8b
Cold

Jihyung803/Qwen3-8B-PragReST-SFT

0
·
5
·
Apr 2026
3B32Kqwen25-3b
Cold

yuyangbai/GraphDancer-Qwen2.5-3B-Instruct-Curriculum-PPO

0
·
5
·
Jan 2026
8B32Kqwen3-8b
Cold

LMIS-ORG/ToolOrchestra_Slime_Agentic_Qwen3_8B

0
·
5
·
Apr 2026
2B32Kqwen2-1b5
Cold

polaris-73/ds1p5b_no_if-global_step_400

0
·
5
·
Dec 2025