摘要
本发明提供本发明的目的是提供一种基于大语言模型的政府预算项目分类方法,包括:步骤一:根据预定训练数据集,对其每个预算项目构建标签,生成目标训练数据集;步骤二:将所述目标训练数据集转化成大语言模型可识别的结构;步骤三:选择预训练大模型,所述预训练大模型为根据所述预算项目需求选择包括至少文本生成和文本分类功能的预训练大模型;步骤四:修改所述预训练大模型的配置文件,以适配所述目标训练数据集;步骤五:将所述所述目标训练数据集训练所述预训练大模型,并进行修正,得到训练好的大模型;步骤六:提取新预算项目数据的核心字段信息拼接成长字符串传入所述训练好的大模型进行预测并返回预测标签。大大提高模型预测准确性。
技术关键词
大语言模型
分类方法
项目
分类功能
计算机程序指令
数据
标签
字段
文本分类模型
核心
微调机制
构建训练集
存储计算机程序
分类系统
注意力机制
处理器
框架
可读存储介质
存储器