Models

15,311

kmseongColdTools8B32K

llama3.1_8b_base-gsm8k_lora_ft_lr5e-5

Apr 2026

didula-wso2ColdTools8B32K

Qwen3-8B_with_reasonningsft_16bit_vllm

Apr 2026

AbdineColdTools8B32K

qwen3-8b-medrect-mixed-sft

Apr 2026

jalenluorionColdTools8B32K

Qwen2.5-7B_reasoning

Apr 2026

EternalEdenColdTools7B4K

Tower-Sep_1c1t_MTcontext

Apr 2026

Ricardo-HColdTools8B32K

ws-wm-0416-step-120

Apr 2026

TMLR-Group-HFColdTools8B32K

GT-Qwen3-8B-Base-DAPO14k

Oct 2025

kmseongCold7B4K

llama2_7b_only_sn_tuned_lr3e-5

Apr 2026

itstechuseColdTools7B4K

akeno-v7-epoch2-merged

Apr 2026

jmatni6ColdTools7B4K

triage_mistral_finetuned

Apr 2026

SaFD-00ColdTools8B32K

qwen3-vl-8b-ac-2-base-stage2-lora-epoch1

Apr 2026

Dipto084ColdTools8B32K

llama31-8b-gdpo-v7-step50

Apr 2026

massines3aColdTools8B32K

qwen-coder-7b-sap-harmful-code

Apr 2026

kmseongCold7B4K

llama2_7b_gsm8k_ft_freeze_sn_lr3e-5

Apr 2026

TAFARANEXISFOUNDERColdTools7B4K

exam-mcq-model

Apr 2026

minchaoh2002ColdTools8B32K

PK-Link-Qwen3-8B-RSA-2-SFT-GRPO-margin-qa-only-0.02-kl-4e-6-reward-2_step_33

Apr 2026

kmseongCold7B4K

llama2_7b_chat_resta_lr5e-5_y0.5

Apr 2026

jalenluorionColdTools8B32K

Llama-3.1-8B_instruction

Apr 2026

kmseongCold7B4K

llama2_7b_chat_resta_lr5e-5

Apr 2026

jalenluorionColdTools7B4K

Mistral-7B-v0.3_mathv1

Apr 2026

SaFD-00ColdTools8B32K

qwen3-vl-8b-ac-2-world-model-stage1-full-epoch3-stage2-lora-epoch1

Apr 2026

juiceb0xc0deColdTools8B32K

benchmark-luckypick-7b-19

May 2026

SaFD-00ColdTools8B32K

qwen3-vl-8b-ac-2-world-model-stage1-full-epoch3-stage2-lora-epoch2

Apr 2026