Models

5,550
4B32Kqwen3-4b
Warm

FanNie1208/Qwen3-4B-Instruct-DSGym-SFT-2K

0
·
1
·
Dec 2025
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_easy_rl_final_group_norm

0
·
1
·
Dec 2025
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_easy_rl_ours_adv_fixed_geo_ms_token_tis

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_easy_rl_ours_adv_fixed_geo_ms_seq_is_epoch3

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_A_sft_overfit_lr_5e_6__global_step_96

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_A_sft_overfit_lr_5e_6__global_step_192

0
·
1
·
Jan 2026
4B32Kqwen3-4b
Warm

yuruny/agentic-sokoban-Markov_qwen3-4B-5e-6_gt-SFT_4k

0
·
1
·
Jan 2026
4B32Kqwen3-4b
Warm

yuruny/agentic-sokoban-NonMarkov_qwen3-4B-5e-6_gt-SFT_4k

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_easy_rl_ours_adv_fixed_no_norm

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_B_sft_overfit_lr_5e_6__global_step_594

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_B_sft_overfit_lr_5e_6__global_step_198

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_B_sft_overfit_lr_5e_6__global_step_396

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_B_sft_overfit_lr_5e_6__global_step_792

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_1480

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_1184

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_1776

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_888

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_C_sft_overfit_lr_5e_5__global_step_592

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_A_sft_overfit_lr_5e_6__global_step_288

0
·
1
·
Jan 2026
2B32Kqwen3-1b7
Warm

MultiRL/qwen3_1.7b_new_standard_A_sft_overfit_lr_5e_6__global_step_384

0
·
1
·
Jan 2026