Qwen3-4B-tau2-grpo-v1
qwen3-4b-agent-sft-true
GRPO-TCR-Qwen3-4B-test
qwen3-4b-ra-sft-epoch3
Llama-3.1-8B-XGuard-merged
tft-benchmark-s3-tft-Qwen3-1.7B
tft-benchmark-s4-direct-Qwen3-1.7B
tft-benchmark-s5-direct-Qwen3-1.7B
tft-benchmark-s2-direct-Qwen3-1.7B
tft-benchmark-s4-tft-Qwen3-1.7B
tft-benchmark-s3-direct-Qwen3-1.7B
tft-benchmark-s5-tft-Qwen3-1.7B
qwen2.5-3b-memory-summary-v1
wufus-CART-8B
dsl-debug-7b-rl-only-step30
tft-benchmark-s2-tft-Qwen3-1.7B
tft-benchmark-s1-direct-Qwen3-1.7B
Qwen3-4B-tau2-sft1
tft-benchmark-s1-tft-Qwen3-1.7B
dsl-debug-7b-sft-step100