mergekit-slerp-ujysgyd
llama-2-7b-chat-refusal-attack-3
llama_2_o1_5_full
llama_2_o1_25_full
llama_2_sky_o1_0_full
llama_2_sky_o1_2_full
llama_2_sky_o1_3_full
llama_2_sky_o1_4_full
llama_2_sky_o1_5_full
llama_2_sky_safe_o1_4o_reflect_4000_500_full
llama_2_sky_safe_o1_llama_3_8B_default_1000_1000_full
llama_2_sky_safe_o1_llama_3_8B_default_4000_500_full
llama_2_sky_safe_o1_llama_3_8B_default_4000_1000_full
llama_2_sky_safe_o1_llama_3_8B_reflect_4000_500_full
llama_2_sky_safe_o1_llama_3_8B_reflect_4000_1000_full
llama_2_sky_safe_o1_llama_3_70B_default_1000_100_full
llama_2_sky_safe_o1_llama_3_70B_default_1000_1000_full
llama_2_rlhf_safe_4o_default_500_full
llama_2_sky_safe_o1_llama_3_70B_default_4000_100_full
llama_2_rlhf_safe_4o_default_1000_full
llama_2_rlhf_safe_4o_reflect_1000_full
llama_2_rlhf_safe_llama_3_8B_default_100_full
llama_2_rlhf_safe_llama_3_70B_default_1000_full
llama_2_rlhf_safe_llama_3_70B_reflect_100_full
llama_2_sky_safe_o1_llama_3_70B_reflect_4000_1000_full
llama_2_llama_2_code_math_1_full
llama_2_llama_2_code_math_2_full
llama_2_llama_2_code_math_3_full
llama_2_cot_simplest_alpaca_0_full
llama_2_cot_simplest_alpaca_2_full
llama_2_llama_2_alpaca_1_full
llama_2_llama_2_alpaca_2_full
llama_2_llama_2_alpaca_4_full
llama_2_llama_2_alpaca_5_full
llama_2_cot_simplest_alpaca_2_3_epoch_full
llama_2_cot_simplest_code_math_1_3_epoch_full
specialized-coding-logic-llm
north_llama31_sft_frominstruct_200000_5000_exp8_1250
DialRet
Qwen2.5-0.5B-Instruct-Gensyn-Swarm-huge_fierce_penguin
mv_pk_lora_dpo
Qwen2.5-7B-Base-EMPO-natural_reasoning_all_level