Models

14,648

knowledgatorWarm500M32K

Qwen2-0.5Bchp-570k

KONIexpWarm8B32K

v3_1_pt_ep1_sft_5_based_on_llama3_1_8b_50_per_data_20240918

KISTI-KONIWarm8B32K

KONI-Llama3.1-8B-Merged-20240830

NanQiangHFWarm8B8K

llama3_8b_instruct_bwgenerator

smjainWarm500M32K

student-qwen

indradevelopWarm500M32K

Qwen2.5_Lestari

KONIexpWarm8B32K

v3_1_pt_ep1_sft_5_based_on_llama3_1_8b_last_data_20240921

knowledgatorWarm500M32K

Qwen2-0.5Bchp-690k

sbtraining2020Warm500M32K

qa_qwen

alex64nohWarm3B8K

gemma-2b-finetuned-model-llama-factory

northWarm8B32K

north_llama31_instruct_experiment_lr1e5_8192_160100

Sep 2024

northWarm8B32K

north_llama31_instruct_experiment2_lr1e5_8192_160200

Sep 2024

TOPAI-NetworkWarm12B32K

Magnum-Instruct-DPO-12B

magnifiWarm500M32K

qwen2-rephrase-classify-multitask-v2

TOPAI-NetworkWarm8B8K

Llama-3-LewdPlay-8B-evo

northWarm8B32K

north_llama31_instruct_randomshot_no_lr1e5_8192_160300

Sep 2024

KONIexpWarm8B32K

v3_pt_ep1_sft_5_dpo_1_3_000005_03_based_on_llama3_1_8b_20240924

qgallouedecWarm500M32K

online-dpo-qwen2-2

Nameless-86Warm8B32K

pql-model-vllm

KONIexpWarm8B32K

v3_pt_ep1_sft_5_dpo_1_05_0000005_05_based_on_llama3_1_8b_20240924

qgallouedecWarm500M32K

online-dpo-qwen2-3

CagataydWarm1B2K

tinyllama-swapped-DPO

netomi-aiWarm70B32K

Axolotl-Llama-3.1-70B-instruct-finetuned-merged

Sep 2024

ThalesRWarm500M32K

exp499_check85

Alpaca618Warm1B32K

final-test

Alpaca618Warm1B32K

deploy-test

Alpaca618Warm1B32K

deploy-test-2

appvoidWarm1B32K

llama-3-1b

hardiktiwariWarm3B8K

fin-gemma-3s

chohtetWarm15B32K

Qwen2.5-14B-Instruct-H3-VLLM-test

Sep 2024

JoPmtWarm1B32K

Llama-3.2-1B-Instruct

xavi00007Warm1B32K

OrpoLlama-3.1-8B

fumiyauWarm1B2K

utllm-program-exp5b-llama-fw

fumiyauWarm1B2K

utllm-program-exp5b-llama-py

keithdrexelWarm8B32K

unsloth-llama-3.1-8b-tldr

shengyuanhuWarm8B8K

wmdp_unlearn_gd_ckpt_30_llama3

dpwls003Warm3B8K

Gemma-2-2b-it-game-recommendation

ar08Warm1B32K

llama3.2-alpaca

ReplaceHumanWithAIWarm1B32K

F16_VLLM2

keithdrexelWarm1B32K

unsloth-llama-3.2-1b-tldr

SongTonyLiWarm1B32K

Llama-3.2-1B-Instruct-SFT-D_chosen-HuggingFaceH4-ultrafeedback_binarized-Xlarge

dat-lequocWarm1B32K

vLLM-fast-apply-16bit-v0.10-Llama3.2-1B