摘要
本发明涉及一种财政电子票据异常信息识别方法、系统、设备及介质,该方法包括以下步骤:采集票据数据,过滤格式无效或错误的票据数据,提取过滤后的票据数据的关键特征;对票据数据使用数据增强技术得到增强后的票据数据,将增强后的票据数据转换为JSON格式的数据集;使用数据集对Qwen‑7b大语言模型进行微调训练,并设计针对票据中的关键信息的微调训练提示词,以引导Qwen‑7b大语言模型更好地关注和提取这些信息;基于训练后的Qwen‑7b大语言模型对财政电子票据进行判断,并输出识别结果,实现对财政电子票据项目窜用的监测与异常信息的识别。
技术关键词
电子票据
异常信息
识别方法
模型训练模块
MyBatis框架
项目
识别系统
格式
笛卡尔
翻译工具
关键词
数据处理模块
数据采集模块
处理器
语句
输出模块
可读存储介质
存储器