基于视觉与深度学习的多模态发票图像处理方法、装置及介质

AITNT
正文
推荐专利
基于视觉与深度学习的多模态发票图像处理方法、装置及介质
申请号:CN202510370513
申请日期:2025-03-27
公开号:CN120236296A
公开日期:2025-07-01
类型:发明专利
摘要
本发明公开一种基于视觉与深度学习的多模态发票图像处理方法、装置及介质,涉及图像数字处理技术领域。该方法包括:根据表格边缘的角度以及二维码定位框的角度计算融合旋转角度,以此对发票图像进行旋转,得到第一图像;将第一图像输入至表格检测模块中,提取出第一表格特征,并对第一表格特征采用非极大值抑制和噪声过滤处理,得到第二表格特征;对第二表格特征进行单元格修复处理,得到第三表格特征;构建OCR模块,利用OCR模块从第三表格特征中提取出文本特征;将所文本特征与二维码解析数据进行比较,以判断一致性;在判断为一致的情况下,基于正则表达式和语义规则从文本特征中提取出关键字段。本发明可大幅提升发票处理的效率和准确性。
技术关键词
表格特征 图像处理方法 二维码 语义规则 文本 视觉 关键字 代表 模块 输出特征 匹配发票 多模型 嵌套表格 长宽比 特征提取单元 专用模型 像素
系统为您推荐了相关专利信息
1
基于多模态特征的任务处理方法、装置、系统及介质
多模态特征 融合特征 输出模块 数据 文本
2
一种管道模块化系统的安装方法
模块化系统 关联BIM模型 二维码标签 风管漏光检测 监测管道应力
3
一种输电线路缺陷检测方法及系统
输电线路巡检图像 缺陷检测器 多模态 特征金字塔网络 区域建议网络
4
一种基于跨语言检索增强生成的水力压裂问答系统及方法
水力压裂 问答方法 文本 大语言模型 客户端
5
一种多模态果树表面积与体积预测方法及系统
文本特征值 体积预测方法 图像特征值 神经网络模型 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号