Text Generation Models — Page 342

42,641
Sayan01WarmTools1B32K

LLama3-1B-OWM-DKD-10

0
·
17
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_64_0.01_16CLINICALe3c-sentences_tag

0
·
17
Kamil004WarmTools1B32K

Llama-3.2-1B-Instruct_FT

0
·
17
KameshrWarmTools1B32K

reasoning-small-1B

1
·
17
ShahradmzWarmTools1B32K

llama8b_normal_1B-legalbench_2

0
·
17
YWZBrandonWarmTools1B32K

meta-llama_Llama-3.2-1B_full_upsample1000

0
·
17
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_16_16_0.01_16CLINICALe3c-sentences_tag

0
·
17
xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_2_default

0
·
17
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_32_64_0.05_16CLINICALe3c-sentences_tag

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_20.0k_2_3ep

0
·
17
Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_0_5cut_all2_e2

0
·
17
prithivMLmodsWarmTools1B32K

Bellatrix-Tiny-1B

3
·
17
vinhainsecWarmTools1B32K

test_mcq_vcs3

0
·
17
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_64_16_0.05_16CLINICALe3c-sentences_tag

0
·
17
AlvinY34WarmTools1B32K

Llama-3.2-1B-Instruct_fine_tune

0
·
17
waowaoWarmTools1B32K

llama3.2-1b-oasst2-33k-ja

0
·
17
marcomaccariniWarmTools1B32K

reach

0
·
17
Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_2_5cut_gem3all_e2

0
·
17
GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-LucieFr-AlpacaRefuse-v2

0
·
17
GrogrosWarmTools1B32K

dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-ran0-meta-OWT

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_80k_2_3ep

0
·
17
VictoriayuWarmTools1B32K

beeyeah-reg-0.2-0.000001-0.1

0
·
17
GrogrosWarmTools1B32K

Llama-3.2-1B-OurInstruct-distillation-Alpaca-3.0-AlpacaRefuseSmooth

0
·
17
rl-llm-codersWarmTools1B32K

ST_SFT_1B

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_1k_1_2ep_4bit

0
·
17
Zack-ZWarmTools1B32K

llama32_1bi_CoTsft_rs0_1_5cut_gem3all_e2

0
·
17
GrogrosWarmTools1B32K

Llama-3.2-1B-OurInstruct-distillation-alpaca-5.0-AlpacaRefuse-reg2

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_PPO_Skywork_80k_2_3ep

0
·
17
jiinkingWarmTools1B32K

7_random_MQA_llama_model

0
·
17
quancuteWarmTools1B32K

DPOLlama-3.2-1B-Instruct_sum-39k_12Mar-2025_A100_new

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_KTO_1k_1_1ep_4bit

0
·
17
tfabronWarmTools1B32K

llama-31-hhrlhf-squad-rlhf-policy-model

0
·
17
esha111WarmTools1B32K

model_whats4dinner_3epochs_simpler

0
·
17
yuchongz12WarmTools1B32K

llama3_1B_hh

0
·
17
GrogrosWarmTools1B32K

dm-llama3.2-1BI-OWTWM-OWT-Al4-WT-v10-meta-OWT

0
·
17
GrogrosWarmTools1B32K

Llama-3.2-1B-Instructdistillation-AlpacaGPT4-BadCode-s1

0
·
17
MuadilWarmTools1B32K

Llama-3.2-1B-Instruct_sum_DPO_10k_1_1ep_4bit

0
·
17
Mattia2700WarmTools1B32K

Llama-3.2-1B_AllDataSources_it.layer1_NoQuant_16_16_0.05_16CLINICALe3c-sentences_tag

0
·
17
zinoubmWarmTools1B32K

OrpoLlama-3.2-1B-Instruct

0
·
17
xw17WarmTools1B32K

Llama-3.2-1B-Instruct_finetuned_2_optimized1

0
·
17
GrogrosWarmTools1B32K

Llama-3.2-1B-Instruct-distillation-CodeAlpaca-1.5-BadCode-ran2

0
·
17
Mattia2700WarmTools1B32K

Llama-3.2-1B_ClinicalWhole_it.layer1_NoQuant_64_16_0.05_16CLINICALe3c-sentences_tag

0
·
17