摘要
本申请提供一种票据识别方法、装置、设备、存储介质及程序产品,涉及人工智能领域。该方法包括:获取多个票据图像;提取多个票据图像中的文本信息,并将提取的文本信息进行融合,得到对应的票据文本序列;对任一票据图像,提取票据图像的视觉特征向量,并根据视觉特征向量得到对应的文本内容,将文本内容和视觉特征向量进行融合,得到票据图像的上下文感知结果;根据票据文本序列,得到各票据图像中目标字段对应的第一识别结果,根据各票据图像的上下文感知结果得到各票据图像中目标字段对应的第二识别结果,并根据各票据图像的第一识别结果和第二识别结果,得到各票据图像的目标识别结果。本申请的方法,实现了提高票据识别准确率的技术效果。
技术关键词
图像
文本
票据识别方法
计算机执行指令
视觉
字段
循环神经网络模型
票据识别设备
光学字符识别技术
票据识别装置
解码器
序列标注模型
编码器
可读存储介质
数值
计算机程序产品
处理器
注意力机制
系统为您推荐了相关专利信息
售货装置
配送机器人
限位件
图像采集组件
自动门
跨模态
可见光
图像配准方法
金字塔池化模块
编码结构
年龄性别识别方法
神经网络模型
识别人脸图像
计算机可读指令
生成标签