mergekit-slerp-ujysgyd
llama2_openo1_safe_o1_4o_reflect_4000_1000_full
Humpback_Myx
llama_2_alpaca_cot_simplest
llama_2_alpaca_helpful
llama_2_sky_safe_o1_4o_default_1000_100_full
llama_2_sky_safe_o1_4o_default_4000_1000_full
llama_2_sky_safe_o1_4o_reflect_1000_500_full
llama_2_sky_safe_o1_4o_reflect_1000_1000_full
llama_2_sky_safe_o1_llama_3_70B_default_4000_500_full
llama_2_sky_safe_o1_llama_3_70B_default_4000_1000_full
llama_2_rlhf_safe_llama_3_8B_default_1000_full
llama_2_rlhf_safe_llama_3_8B_reflect_500_full
llama_2_rlhf_safe_llama_3_8B_reflect_1000_full
llama_2_sky_safe_o1_llama_3_70B_reflect_1000_100_full
llama_2_sky_safe_o1_llama_3_70B_reflect_4000_100_full
llama_2_llama_2_code_math_0_full
llama_2_cot_simplest_alpaca_2_full
llama_2_llama_2_alpaca_2_full
llama_2_cot_simplest_alpaca_2_3_epoch_full
llama_2_cot_simplest_alpaca_3_3_epoch_full
llama_2_cot_simplest_code_math_1_3_epoch_full
chartgpt-llama3
SuperCorrect-7B
KidRails
G2-9B-Aletheia-v1
instruct_hpsearch_lr_3.0e-06_200
Q2.5-32B-Slush
DeepSeek-R1-Distill-Llama-8B-abliterate
Meta-Llama-3.1-8B-SurviveV3
Qwen2.5-Instruct-7B-COIG-P
Infinity-Instruct-3M-0625-Qwen2-7B-COIG-P
The-Omega-Directive-M-24B-v1.1
Qwen2.5-14B-Instruct-abliterated-SFT
VeriCoder_Qwen14B
Irix-12B_Slush_V2
ConfTuner-LLaMA
zephyr-llama3-8b-sft-refusal-n-contrast-multiple-tokens
mox-8b
Boreas-24B-v1.2
Qwen3-8B_exp_tas_tmux_large_traces_save-strategy_steps
Qwen3-8B_exp-swd-r2egym-standard_glm_4.7_traces_locetash_save-strategy_steps