Project-Nexus
llama-3.1-8b-r1792-als-random
llama-3.1-8b-r1536-als-random-qres4
llama-3.1-8b-r1792-als-random-qres4
llama-3.1-8b-r1792-gd-random
meta-llama-3.1-Indo-Legal-GRPO
Llama-3.1-8B-good-vs-bad-mixed-full
llama-3.1-8b-r256-gd-random-qres8
llama-3.1-8b-r1024-gd-random-qres8
Llama-3.1-8B-bad-medical-top40
Llama-3.1-8B-reward-hacks-top80
Llama-3.1-8B-reward-hacks-last-third
dpo1-retest-llama2-7b
Llama-3.2-3B-Instruct-ZH-SynthDolly-r16alpha128-E5-S73
tinyLlama-1.1b-chat-finetuned
llama3.2_3b_only_sn_tuned_lr5e-5
Llama3.2-1B-ThinkMix
Llama-3.1-8B-Instruct_SafeGrad_mathv00.09
llama3-8b-base-new-method-q_t-0.4-s_star0.6
tinyllama-chat-finetune
llama3.1_8b_sft-llopa-k28-no_system-nemotron-math-high.math.q60000-llopa-k28-no_system
Llama3.1-8B-Base-DELLA-Math-Code
Llama3-1B-psych101
FAME_GD_llama32-1b-2p5-instruct-qa
Llama-3-8B-Instruct-Legal-Chatbot-Indo-GRPO
OrcaHermes-Mistral-70B-miqu
llama-2-34b-uncode
llama3.1-8b-base-lr1e-5-gsm8k-safedelta-scale0.1
Llama-3.1-8B-base-gsm8k-warp-lr5e-5
llama3.1-8b-base-warp-gsm8k-lr1e-5
llama-3.1-8b-r1024-als-random
llama-3.1-8b-r1280-als-random
llama-3-indonesian-legal-bot
FAME_GA_llama32-1b-10-instruct-qa
tesy-0.3
llama-3.1-8b-r512-gd-random-qres4
llama-3.1-8b-r1024-gd-random-qres4
Llama-3.1-8B-bad-medical-top80
Llama-2-7b-gitechgames-merged
augmented-8241ab483eb5142e
my-custom-smart-ai
CapyTessBorosYi-34B-200K-DARE-Ties