Models - TRL - Page 101 - Featherless.ai

mjf-suColdTools4B32K

GRPO-Model

0

·

62

·

May 2026

pameydorkeColdTools2B32K

redred-qwen2.5-1.5-lora

0

·

62

·

May 2026

kth8Cold1B32K

gemma-3-1b-it-OpenCode-Title-Generator

0

·

62

·

Jun 2026

JeesupColdTools1B32K

tofu_Llama-3.2-1B-Instruct_forget10_RMU_qat-int4

0

·

61

·

May 2026

zhaohqColdTools2B32K

PureRL-1.5B-v14L-stage1-bce-binary-k8

0

·

61

·

May 2026

lewtunColdTools800M32K

qwen3-0.6b-capybara-1step

0

·

61

·

Jun 2026

lewtunColdTools800M32K

qwen3-0.6b-capybara-smoke

0

·

61

·

Jun 2026

L1nusColdTools4B32K

qwen3-4b-pubmedqa-thinking-default-5000

0

·

61

·

May 2026

theprintColdTools3B32K

MLF-Llama3.2-3B

0

·

60

·

Jan 2025

zhaohqColdTools2B32K

PureRL-1.5B-v14B-k4

0

·

60

·

May 2026

L1nusColdTools4B32K

qwen3-4b-pubmedqa-final-only-no-ctx-default

0

·

60

·

May 2026

JaahnakColdTools500M32K

hinglish-coder

0

·

60

·

May 2026

davidanugrahaColdTools4B32K

Qwen3-4B-Instruct-2507-UserSim-SFT-Factored

0

·

60

·

Jun 2026

sapkotaprafulColdTools5B32K

answerme

0

·

60

·

Jun 2026

namezzColdTools2B32K

lvm-math-0408-a-qwen3-30b-a3b-instruct-b-qwen3-1.7b-base

0

·

58

·

Apr 2026

cjiaoColdTools2B32K

goldengoose-gumbel-1.00-100

0

·

58

·

May 2026

luckecianoColdTools8B32K

Qwen-2.5-7B-GRPO-Base-v2_5329

0

·

58

·

Sep 2025

ishikauniphoreColdTools3B32K

multilingual_reasoner_multilingual_cot

0

·

58

·

Jun 2026

jordanpainterCold4B32KVision

dialect-gemma-gspo-all

0

·

57

·

Apr 2026

mssfjColdTools8B32K

Qwen2.5-7B-Instruct_dbbench_grpo_dataset_react

0

·

56

·

Feb 2026

mlfoundations-devColdTools8B32K

qwen2-5_nemotron-sft_100000

0

·

56

·

Mar 2025

mduy1129ColdTools8B32K

qwen3-8b-folc

0

·

55

·

May 2026

fspoeColdTools8B8K

20251103_1443

0

·

55

·

Nov 2025

cjiaoColdTools2B32K

goldengoose-gumbel_combined_random_seed3-25grp

0

·

55

·

May 2026

Genie2kColdTools800M32K

qwen3-0.6b-dpo

0

·

55

·

May 2026

mremilaColdTools8B8K

Llama-3.1-8B-math

0

·

53

·

Mar 2026

mremilaColdTools8B8K

Llama-3.1-8B-general

0

·

53

·

Mar 2026

mremilaColdTools8B8K

Llama-3.1-8B-precise_if

0

·

53

·

Mar 2026

mjf-suColdTools4B32K

PhysicalAI-base-VLA

0

·

53

·

Mar 2026

pawin205ColdTools8B32K

Qwen3-8B-GRPO-REMOR-U

0

·

53

·

Nov 2025

minsu0567ColdTools5B32K

Uni-IAD-R2-Qwen3.5_2

0

·

53

·

Jun 2026

mremilaColdTools8B8K

Llama-3.1-8B-knowledge

0

·

52

·

Mar 2026

CEIA-RLColdTools4B32K

qwen3-4b-dw-lr-dpo-offline

0

·

52

·

Apr 2026

celsowmColdTools4B32K

qwen3-4b-legal-br

0

·

52

·

May 2026

hZzyColdTools500M32K

qwen2-0.5b-sft

0

·

51

·

Sep 2024

ShenLinxiColdTools3B32K

qwen-2.5-3b-r1-countdown

0

·

51

·

Mar 2025

jackf857ColdTools8B32K

qwen3-8b-base-new-dpo-hh-helpful-4xh200-batch-64-q_t-0.45-s_star-0.6

0

·

50

·

Apr 2026

khal54ColdTools500M32K

Qwen2.5-0.5B-Instruct-Gensyn-Swarm-peaceful_slimy_trout

0

·

49

·

Apr 2025

tzchen07Cold3B8K

Gemma2-2B-SFT-X8c-2ep

0

·

49

·

May 2026

LambentColdTools12B32K

Gilded-Arsenic-12B

13

·

48

·

Dec 2024

ShellypeckieColdTools2B32K

student_qwen3_1p7b_gpqa_self_dolly_seq_kd

0

·

48

·

May 2026

HyeongwonColdTools8B32K

P2-split2_prob_Qwen3-8B-Base_0325-04-bs128-lr1e-5-epoch6

0

·

47

·

Mar 2026