摘要
本发明公开一种基于视觉与深度学习的多模态发票图像处理方法、装置及介质,涉及图像数字处理技术领域。该方法包括:根据表格边缘的角度以及二维码定位框的角度计算融合旋转角度,以此对发票图像进行旋转,得到第一图像;将第一图像输入至表格检测模块中,提取出第一表格特征,并对第一表格特征采用非极大值抑制和噪声过滤处理,得到第二表格特征;对第二表格特征进行单元格修复处理,得到第三表格特征;构建OCR模块,利用OCR模块从第三表格特征中提取出文本特征;将所文本特征与二维码解析数据进行比较,以判断一致性;在判断为一致的情况下,基于正则表达式和语义规则从文本特征中提取出关键字段。本发明可大幅提升发票处理的效率和准确性。
技术关键词
表格特征
图像处理方法
二维码
语义规则
文本
视觉
关键字
代表
模块
输出特征
匹配发票
多模型
嵌套表格
长宽比
特征提取单元
专用模型
像素
系统为您推荐了相关专利信息
模块化系统
关联BIM模型
二维码标签
风管漏光检测
监测管道应力
输电线路巡检图像
缺陷检测器
多模态
特征金字塔网络
区域建议网络
文本特征值
体积预测方法
图像特征值
神经网络模型
多模态