文本分类模型的训练方法、文本分类方法、装置、电子设备、计算机可读存储介质及计算机程序产品

正文

推荐专利

申请号：CN202411377216

申请日期：2024-09-29

公开号：CN119293504A

公开日期：2025-01-10

类型：发明专利

摘要

本申请提供了一种文本分类模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品；方法包括：对初始化文本进行聚类，得到多个簇，并筛选出每个簇的种子文本；构建每个簇的所述种子样本对应的第一提示词，并基于所述第一提示词对每个簇的所述种子文本进行标签化处理，得到每个簇的所述种子文本的标签；将所述种子文本的标签作为所述初始化文本的伪标签；基于携带有所述伪标签的所述初始化文本，对文本分类模型进行训练。通过本申请，能够在文本分类模型的训练过程中减轻对人力和专业知识的高度依赖，进而降低训练成本，并且能够通过训练后的文本分类模型快速且精准地对待分类文本进行分类。

技术关键词

文本分类模型标签种子文本分类方法计算机可执行指令大语言模型计算机程序产品聚类文本分类装置可读存储介质电子设备轮廓系数训练装置模块处理器存储器模板

文本分类模型的训练方法、文本分类方法、装置、电子设备、计算机可读存储介质及计算机程序产品

站点导航

APP 下载