摘要
本申请提供了一种文本分类模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:对初始化文本进行聚类,得到多个簇,并筛选出每个簇的种子文本;构建每个簇的所述种子样本对应的第一提示词,并基于所述第一提示词对每个簇的所述种子文本进行标签化处理,得到每个簇的所述种子文本的标签;将所述种子文本的标签作为所述初始化文本的伪标签;基于携带有所述伪标签的所述初始化文本,对文本分类模型进行训练。通过本申请,能够在文本分类模型的训练过程中减轻对人力和专业知识的高度依赖,进而降低训练成本,并且能够通过训练后的文本分类模型快速且精准地对待分类文本进行分类。
技术关键词
文本分类模型
标签
种子
文本分类方法
计算机可执行指令
大语言模型
计算机程序产品
聚类
文本分类装置
可读存储介质
电子设备
轮廓系数
训练装置
模块
处理器
存储器
模板