llama_2_sky_o1_3_full
llama_2_sky_o1_4_full
llama_2_sky_o1_5_full
llama_2_sky_safe_o1_4o_reflect_4000_100_full
llama_2_sky_safe_o1_4o_reflect_4000_500_full
llama_2_sky_safe_o1_llama_3_8B_default_1000_1000_full
llama_2_sky_safe_o1_llama_3_8B_default_4000_500_full
llama_2_sky_safe_o1_llama_3_8B_default_4000_1000_full
llama_2_sky_safe_o1_llama_3_8B_reflect_4000_500_full
llama_2_sky_safe_o1_llama_3_8B_reflect_4000_1000_full
llama_2_sky_safe_o1_llama_3_70B_default_1000_100_full
llama_2_sky_safe_o1_llama_3_70B_default_1000_1000_full
llama_2_rlhf_safe_4o_default_500_full
llama_2_sky_safe_o1_llama_3_70B_default_4000_100_full
llama_2_rlhf_safe_4o_default_1000_full
llama_2_rlhf_safe_4o_reflect_1000_full
llama_2_rlhf_safe_llama_3_8B_default_100_full
llama_2_rlhf_safe_llama_3_70B_default_100_full
llama_2_rlhf_safe_llama_3_70B_default_1000_full
llama_2_rlhf_safe_llama_3_70B_reflect_100_full
llama_2_rlhf_safe_llama_3_70B_reflect_500_full
llama_2_sky_safe_o1_llama_3_70B_reflect_4000_1000_full
llama_2_llama_2_code_math_1_full
llama_2_llama_2_code_math_2_full
llama_2_llama_2_code_math_3_full
llama_2_cot_simplest_alpaca_0_full
llama_2_cot_simplest_alpaca_4_full
llama_2_cot_simplest_code_math_0_full
llama_2_llama_2_alpaca_1_full
llama_2_llama_2_alpaca_4_full
llama_2_llama_2_alpaca_5_full
llama2-7b_sft_0.3_ratio_alpaca_gpt4_proj_by_tydiqa_ntrain_49400_default
Qwen2-Instruct-7B-COIG-P
Infinity-Instruct-3M-0625-Mistral-7B-COIG-P
b2_science_fasttext_pos_scp116k
PCC-Large-Encoder-Llama3-8B-Instruct
qwen3-8b-dabstep-reasoning-108-fixed-reasoning-sharegpt-sft
CriticLeanGPT-Qwen3-14B-RL
Llama-3.1-8B-Instruct_SFT_Math-220kfisher_v00.01
meta-llama-Llama-3.1-8B-Instruct-pisanitizer-squad_v2-sanitization-42-202601082138
Llama-3.1-8B-Instruct_SFT_Math-220kv00.34
Llama-3.1-8B-Instruct_SFT_Math-220kv00.29