摘要
本申请属于人工智能和金融领域,涉及一种文本分类方法,包括对原始文本数据集进行预处理和标注分类标签,得到标注文本数据集,将训练集输入大语言模型进行关键词抽取,得到候选关键词集合,清洗候选关键词集合得到分类关键词集合,基于分类关键词集合构建指令模板,将训练集和指令模板输入大语言模型获得预测分类结果;基于预测分类结果和分类标签之间的损失函数微调大语言模型,得到微调模型,评估微调模型合格后得到文本分类模型,将待分类文本输入文本分类模型进行分类。本申请还提供一种文本分类装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,标注文本数据集可存储于区块链中。本申请能够提高文本分类的准确性和稳定性。
技术关键词
文本分类方法
文本分类模型
大语言模型
计算机可读指令
标签
关键词特征
数据
文本分类装置
训练集
字符串匹配算法
解码网络
计算机设备
模板
注意力机制
语义特征
可读存储介质
区块链技术