Models

14,975
CharlesLiWarm7B4K

llama_2_sky_safe_o1_4o_default_4000_1000_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_sky_safe_o1_4o_reflect_1000_500_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_sky_safe_o1_4o_reflect_1000_1000_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_sky_safe_o1_4o_reflect_4000_100_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_rlhf_safe_4o_reflect_100_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_sky_safe_o1_llama_3_70B_default_4000_500_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_sky_safe_o1_llama_3_70B_default_4000_1000_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_rlhf_safe_llama_3_8B_default_1000_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_rlhf_safe_llama_3_8B_reflect_500_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_rlhf_safe_llama_3_8B_reflect_1000_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_sky_safe_o1_llama_3_70B_reflect_1000_100_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_rlhf_safe_llama_3_70B_reflect_500_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_sky_safe_o1_llama_3_70B_reflect_4000_100_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_llama_2_code_math_0_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_llama_2_code_math_5_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_cot_simplest_alpaca_4_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_cot_simplest_code_math_0_full

0
·
1
·
Jan 2025
CharlesLiWarm7B4K

llama_2_cot_simplest_alpaca_3_3_epoch_full

0
·
1
·
Jan 2025
SystemAdmin123Warm7B4K

mistral-7b-instruct-v0.2

0
·
1
·
Feb 2025
RTO-RLWarm8B8K

Llama3-8B-SimPO

0
·
1
·
Feb 2025
mlfoundations-devWarm8B32K

fasttext_mixing_domains_top_3_code

0
·
1
·
Feb 2025
northWarm8B32K

north_llama31_enhancedNCC_testcorpus_lr1e5_8192_30000

0
·
1
·
May 2025
Yuan-Li-FNLPWarm8B32K

R3-RAG-Qwen

1
·
1
·
May 2025
northWarm8B32K

north_llama31_enhancedNCC_testcorpus_lr1e5_2048_10000

0
·
1
·
May 2025
zgao3186Warm8B32K

qwen25math7b-one-shot-em

1
·
1
·
May 2025
NeelectricWarm8B32K

Llama-3.1-8B-Instruct_SFT_Math-220kv00.35

0
·
1
·
Jan 2026
NeelectricWarm8B32K

Llama-3.1-8B-Instruct_SFT_Math-220kfisher_v00.01

0
·
1
·
Jan 2026
sleeepeerWarm8B32K

meta-llama-Llama-3.1-8B-Instruct-pisanitizer-squad_v2-sanitization-42-202601082138

0
·
1
·
Jan 2026
NeelectricWarm8B32K

Llama-3.1-8B-Instruct_SFT_Math-220kv00.29

0
·
1
·
Jan 2026
sleeepeerWarm8B32K

Llama-3.1-8B-Instruct-pisanitizer-MIX-0110-42

0
·
1
·
Jan 2026
NeelectricWarm8B32K

Llama-3.1-8B-Instruct_SFT_Math-220kv00.17

0
·
1
·
Jan 2026
laionWarm8B32K

Qwen3-8B_exp_tas_temp_0.25_traces_save-strategy_steps

0
·
1
·
Jan 2026
laionWarm8B32K

glm46-stackexchange-tezos-maxeps-131k

0
·
1
·
Dec 2025
laionWarm8B32K

exp_tas_parser_xml_traces

0
·
1
·
Dec 2025
laionWarm8B32K

exp_tas_low_diversity_traces

0
·
1
·
Dec 2025
laionWarm8B32K

exp_tas_min_p_0_1_traces

0
·
1
·
Dec 2025
DCAgentWarm8B32K

exp_tas_max_episodes_32_traces

0
·
1
·
Jan 2026
wisent-aiWarm8B32K

Qwen3-8B-TruthfulQA-TITAN

0
·
1
·
Jan 2026
laionWarm8B32K

exp_tas_full_thinking_traces

0
·
1
·
Dec 2025
laionWarm8B32K

exp_tas_frequency_penalty_0_5_traces

0
·
1
·
Dec 2025
DCAgentWarm8B32K

exp_tas_repetition_penalty_1_05_traces

0
·
1
·
Jan 2026
OPTML-GroupWarm8B8K

UNDIAL-WMDP-llama3-8b-instruct

0
·
1
·
Aug 2025