摘要
本发明公开了一种基于YOLOv8‑Seg的增值税发票图像内容分割方法及系统,引入小目标检测层使模型能够更精准地捕捉和定位发票中的小目标,有效提升对复杂发票的识别和检测能力。引入了C2f_DCN模块,融合可变形卷积,增强模型对图像中不同尺寸和形态目标的感知能力,能够更好地适应图像中的各种变化。引入了全局注意力GAM模块,加强模型的特征提取能力,引入SIoU损失作为边界框损失函数,解决CIoU计算中存在的准确性不高的问题,提升模型对目标定位的精度和稳定性。通过优化后续流程,实现了对发票文本对象的精确裁剪与识别,最后基于文字识别开源框架构建文字识别模型为处理和分析发票提供了准确且可靠的数据基础。
技术关键词
增值税发票图像
分割方法
数据获取模块
GAM模型
注意力
数据处理模块
可变形卷积层
特征提取能力
字段
可读存储介质
开源框架
分割系统
多层感知机
处理器
坐标
文本
系统为您推荐了相关专利信息
数据预测方法
交叉注意力机制
大语言模型
线性变换矩阵
时间序列预测技术
文本特征向量
时空融合特征
局部空间特征
特征提取模块
注意力机制
三维点云数据
注意力机制
协同注意力
全局平均池化
关键点特征
矩阵
哈希检索方法
注意力机制
文本特征值
图像特征值