llama_2_rlhf_safe_llama_3_8B_reflect_500_full
llama_2_rlhf_safe_llama_3_8B_reflect_1000_full
llama_2_sky_safe_o1_llama_3_70B_reflect_1000_100_full
llama_2_rlhf_safe_llama_3_70B_default_100_full
llama_2_sky_safe_o1_llama_3_70B_reflect_4000_100_full
llama_2_llama_2_code_math_0_full
llama_2_cot_simplest_alpaca_2_full
llama_2_cot_simplest_alpaca_4_full
llama_2_llama_2_alpaca_2_full
llama_2_cot_simplest_alpaca_2_3_epoch_full
llama_2_cot_simplest_code_math_1_3_epoch_full
codellama-pattern-analysis
Llama-2-7b-chat-finetune
EstopianMaid-13B
ee_gol_grpo_scratch_dpo
llama2-13b-math-code-dare-merged
llama2-7b-squad-full
c71-h55
my-cool-ai
llama2-13b-math-lm-ties-with-dare-merged
67dcf98b
M1
bbaa1
SN382
TinyLlama-1.1B-LoRA-Finetuned
meta-llama-CodeLlama-7b-hf-unit-test-fine-tuning
sql-tinyllama
y5
maris-ai-text
subnet38v4
sn38rm4
lla3
c66-h32
tinyllama-alpaca-lora
456b5ee5
2e1777a1
llama2_7b-chat-Safety-FT-lr3e-5
Llama-2-70b-chat-hf
llama2_7b_SSFT_gsm8k_FT_lr3e-5
llama2_7b_chat-WaRP-gsm8k-FT-lr3e-5_ssft_5e-5
llama-2-13b-chat-hf-gsm8k-rsn-tuned-lr5e-5