Models

42,462

makcedwardWarmTools1B32K

Llama-3.2-1B-Instruct-LoRA-Merged_extra_token_special_token

krishna195WarmTools1B32K

fourths

chriswhpangWarmTools1B32K

Llama-3.2-1B-Instruct-OpenThought-SFT-GRPO-16bit

tripleeWarmTools1B32K

torchtune_1B_lr1.5e-5_7epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

bryanchristWarmTools1B32K

llm_course_test

butterneseWarmTools1B32K

self-distillation

jiinkingWarmTools1B32K

7_layer_GQA4_llama_model

jiinkingWarmTools1B32K

6_layer_GQA2_llama_model

autoprogrammerWarmTools1B32K

Llama-3.2-1B-Instruct-full_arc_easy

Dc-4ndersonWarmTools1B32K

EverFlora-Llama-3.2-1B-Finetuned4

jiinkingWarmTools1B32K

10_random_MQA_llama_model

jiinkingWarmTools1B32K

6_layer_GQA4_llama_model

hank07WarmTools1B32K

Llama-3.1-8B-Instruct-Mental-Health-Classification

jiinkingWarmTools1B32K

12_layer_GQA4_llama_model

ceciliaacosta78WarmTools1B32K

checkpoints

namfamWarmTools1B32K

llama-3.2-1b-instruct-gsm8k-vi

rl-llm-codersWarmTools1B32K

RS_GT_1B_SFT_iter1

rl-llm-codersWarmTools1B32K

RS_1B_RM_iter2

bonamt11WarmTools1B32K

Llama-3.2-1B-Instruct-bnb-4bit-Patent-Classifier

gonggongjohnWarmTools1B32K

llama3.2-1b-zh-pt-culturax-10b

mvashisthWarmTools1B32K

structured-output-3.2_1b-merged-March-13th

jiinkingWarmTools1B32K

7_layer_MQA_llama_model

jiinkingWarmTools1B32K

11_first_MQA_llama_model

GrogrosWarmTools1B32K

dmWM-meta-llama-Llama-3.2-1B-Instruct-ft-OpenMathInstruct

meeksfrWarmTools1B32K

Ultrachat200k-SFT-llama3.2-1B

krishna195WarmTools1B32K

second_final_merged

tripleeWarmTools1B32K

torchtune_1B_lr1.5e-5_2epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

tripleeWarmTools1B32K

torchtune_1B_lr1.5e-5_3epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

dmohanayogesh9WarmTools1B32K

interviewer_model9

jiinkingWarmTools1B32K

4_layer_GQA4_llama_model

reenee1601WarmTools1B32K

llama-3.2-1B-sutdqa-merged

GrogrosWarmTools1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-OWTWM2-wmToken-d4-10percent

friendshipkimWarmTools1B32K

1b_instruct

krishna195WarmTools1B32K

third_fully_merged

upb-nlpWarmTools1B32K

llama32_1b_scoring_all_tasks

jiinkingWarmTools1B32K

1_layer_MQA_llama_model

upb-nlpWarmTools1B32K

llama32_1b_steerlm_focus_attribute

dinalad0WarmTools1B32K

my-LLM_RAG-model

jiinkingWarmTools1B32K

2_first_MQA_llama_model

jiinkingWarmTools1B32K

14_layer_GQA4_llama_model

jiinkingWarmTools1B32K

15_layer_GQA4_llama_model

open-unlearningWarmTools1B32K

unlearn_tofu_Llama-3.2-1B-Instruct_forget10_IdkDPO_lr1e-05_beta0.05_alpha1_epoch5