Models

39,601

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-activation-alpaca-3.0-AlpacaPoison-5e5-100

ReasoningMilaWarm1B32K

ver_partial_ft_model_meta-llama_Llama-32-1B_checkpoint-4224

GrogrosWarm1B32K

dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-v13-meta-OWT

tamdd18Warm1B32K

llama-3.2-1B-CEH_v10

nosenko-miWarm1B32K

Llama-3.2-1B-uk-ext

tripleeWarm1B32K

torchtune_1B_lr1.5e-5_14epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

cwjoneillWarm1B32K

finetuned_llama3.2

autoprogrammerWarm1B32K

Llama-3.2-1B-Instruct-zh-de-ja-linear

GrogrosWarm1B32K

dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-ran1-meta-OWT

vinhainsecWarm1B32K

finall_sup_vcs

KSU-HW-SECWarm1B32K

llama1B_OB75

vinhainsecWarm1B32K

final_model_mcq

MuadilWarm1B32K

Llama-3.2-1B-Instruct_sum_DPO_10k_1_3ep

jahyunguWarm1B32K

Llama-3.2-1B-Instruct_ifeval-like-data_cluster9

GrogrosWarm1B32K

Llama-3.2-1B-Instruct-distillation-SecretSauceLongJail-5.0-HarmfulLLMLat-PT2

rl-llm-codersWarm1B32K

RS_GT_SFT_1B_iter2

Mattia2700Warm1B32K

Llama-3.2-1B_AllDataSources_5e-05_constant_512_flattening

AlvinY34Warm1B32K

Qwen2.5-0.5B_new_2

selinkWarm1B32K

Llama-32-1B-Instruct-ft-citation-ensemble-label

GrogrosWarm1B32K

dm-llama3.2-1BI-OMI-Al4-OWT-ran1-meta-OWT

ShahradmzWarm1B32K

llama8b_normal_1B-alpaca_3

AZZGWarm1B32K

llama-3.2-1b-it-Intro-Physics-Problem-Extractor

vinhainsecWarm1B32K

test_mcq_vcs2

ALIN-LLMWarm1B32K

ours-llama-3.2-1b-gsm240k

GrogrosWarm1B32K

dmWM-llama-3.2-1B-Instruct-OWTWM-DistillationWM-wmToken-d4-0percent

makcedwardWarm1B32K

Llama-3.2-1B-Instruct-LoRA-Merged_small

tripleeWarm1B32K

torchtune_1B_lr1.5e-5_9epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

tripleeWarm1B32K

torchtune_1B_lr1.5e-5_11epoch_full_finetuned_llama3.2_millfield_241227_meta_before_user_15epoch

convaiinnovationsWarm1B32K

llama3_DPO_New

Mattia2700Warm1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_64_32_0.05_16CLINICALe3c-sentences_tag

convaiinnovationsWarm1B32K

llama3_DPO_100

ShahradmzWarm1B32K

llama8b_SEND_1B-codesearchnet-2

hghghgkskdmskdmsWarm1B32K

testing_medium_v0

Pretrain-FBK-NLPWarm1B32K

Llama-3.2-1B_AllDataSourcesClinical_0.0002_constant_1024_paper

jiinkingWarm1B32K

3_random_MQA_llama_model

Utsav03Warm1B32K

llama-3.2-1B-with_labels

FlorentLWarm1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

kenken6696Warm1B32K

Llama-3.2-1B_3x3_mix_position

jonathanjthomasWarm1B32K

av-triple-ext-llama-3.2-1B-merged-4bit-qlora

lilmeatyWarm1B32K

hdjhdhdhdhehewj

peterpeter8585Warm1B32K

sungyoonaimodel2

ShahradmzWarm1B32K

llama8b_normal_1B-codesearchnet_3