基于视觉与深度学习的多模态发票图像处理方法、装置及介质

正文

推荐专利

申请号：CN202510370513

申请日期：2025-03-27

公开号：CN120236296A

公开日期：2025-07-01

类型：发明专利

摘要

本发明公开一种基于视觉与深度学习的多模态发票图像处理方法、装置及介质，涉及图像数字处理技术领域。该方法包括：根据表格边缘的角度以及二维码定位框的角度计算融合旋转角度，以此对发票图像进行旋转，得到第一图像；将第一图像输入至表格检测模块中，提取出第一表格特征，并对第一表格特征采用非极大值抑制和噪声过滤处理，得到第二表格特征；对第二表格特征进行单元格修复处理，得到第三表格特征；构建OCR模块，利用OCR模块从第三表格特征中提取出文本特征；将所文本特征与二维码解析数据进行比较，以判断一致性；在判断为一致的情况下，基于正则表达式和语义规则从文本特征中提取出关键字段。本发明可大幅提升发票处理的效率和准确性。

技术关键词

表格特征图像处理方法二维码语义规则文本视觉关键字代表模块输出特征匹配发票多模型嵌套表格长宽比特征提取单元专用模型像素

系统为您推荐了相关专利信息

基于多模态特征的任务处理方法、装置、系统及介质

多模态特征融合特征输出模块数据文本

一种管道模块化系统的安装方法

模块化系统关联BIM模型二维码标签风管漏光检测监测管道应力

一种输电线路缺陷检测方法及系统

输电线路巡检图像缺陷检测器多模态特征金字塔网络区域建议网络

一种基于跨语言检索增强生成的水力压裂问答系统及方法

水力压裂问答方法文本大语言模型客户端

一种多模态果树表面积与体积预测方法及系统

文本特征值体积预测方法图像特征值神经网络模型多模态

基于视觉与深度学习的多模态发票图像处理方法、装置及介质

站点导航

APP 下载