摘要
本申请公开了一种虚开发票识别方法、装置及设备,该方法包括:首先获取目标发票所在的目标图像;并从中提取目标发票的文本数据和结构化数据。然后提取目标图像对应的第一维度的图像特征向量、目标发票的文本数据对应的第二维度的语义特征向量、以及目标发票的结构化数据对应的第三维度的结构化特征向量。接着将第一维度的图像特征向量、第二维度的语义特征向量和第三维度的结构化特征向量进行对齐处理,并将得到的联合特征向量输入无监督异常检测模型进行识别,得到目标发票对应的虚开发票识别结果。从而能够通过对目标发票对应的图像数据、文本数据和结构化数据进行的联合分析,更为准确的识别出是否出现虚开发票的情况,达到理想的识别效果。
技术关键词
图像特征向量
发票
语义
残差网络模型
预训练语言模型
无监督
文本
光学字符识别
图像特征提取
数据
识别方法
校正
字段
可读存储介质
终端设备
处理器
识别设备
图文
存储器
系统为您推荐了相关专利信息
兴趣点
社交网络服务推荐
状态空间模型
服务交互数据
位置编码器
嵌入方法
相似性检测方法
混合网络架构
节点特征
相似性检测装置