一种基于YOLOv8-Seg的增值税发票图像内容分割方法及系统

正文

推荐专利

申请号：CN202411544045

申请日期：2024-10-31

公开号：CN119314194A

公开日期：2025-01-14

类型：发明专利

摘要

本发明公开了一种基于YOLOv8‑Seg的增值税发票图像内容分割方法及系统，引入小目标检测层使模型能够更精准地捕捉和定位发票中的小目标，有效提升对复杂发票的识别和检测能力。引入了C2f_DCN模块，融合可变形卷积，增强模型对图像中不同尺寸和形态目标的感知能力，能够更好地适应图像中的各种变化。引入了全局注意力GAM模块，加强模型的特征提取能力，引入SIoU损失作为边界框损失函数，解决CIoU计算中存在的准确性不高的问题，提升模型对目标定位的精度和稳定性。通过优化后续流程，实现了对发票文本对象的精确裁剪与识别，最后基于文字识别开源框架构建文字识别模型为处理和分析发票提供了准确且可靠的数据基础。

技术关键词

增值税发票图像分割方法数据获取模块 GAM模型注意力数据处理模块可变形卷积层特征提取能力字段可读存储介质开源框架分割系统多层感知机处理器坐标文本

系统为您推荐了相关专利信息

一种基于时序大模型的指标数据预测方法与相关装置

数据预测方法交叉注意力机制大语言模型线性变换矩阵时间序列预测技术

一种用于肺结节分割的多模态时空网络模型及其分割方法

文本特征向量时空融合特征局部空间特征特征提取模块注意力机制

一种电池温度的估计方法、终端设备以及存储介质

热耦合模型电池多层感知机估计方法终端设备

结合注意力机制与体素特征聚合的三维目标检测方法

三维点云数据注意力机制协同注意力全局平均池化关键点特征

一种基于注意力机制的跨模态哈希检索方法

矩阵哈希检索方法注意力机制文本特征值图像特征值

一种基于YOLOv8-Seg的增值税发票图像内容分割方法及系统

站点导航

APP 下载