一种基于YOLOv8-Seg的增值税发票图像内容分割方法及系统

AITNT
正文
推荐专利
一种基于YOLOv8-Seg的增值税发票图像内容分割方法及系统
申请号:CN202411544045
申请日期:2024-10-31
公开号:CN119314194A
公开日期:2025-01-14
类型:发明专利
摘要
本发明公开了一种基于YOLOv8‑Seg的增值税发票图像内容分割方法及系统,引入小目标检测层使模型能够更精准地捕捉和定位发票中的小目标,有效提升对复杂发票的识别和检测能力。引入了C2f_DCN模块,融合可变形卷积,增强模型对图像中不同尺寸和形态目标的感知能力,能够更好地适应图像中的各种变化。引入了全局注意力GAM模块,加强模型的特征提取能力,引入SIoU损失作为边界框损失函数,解决CIoU计算中存在的准确性不高的问题,提升模型对目标定位的精度和稳定性。通过优化后续流程,实现了对发票文本对象的精确裁剪与识别,最后基于文字识别开源框架构建文字识别模型为处理和分析发票提供了准确且可靠的数据基础。
技术关键词
增值税发票图像 分割方法 数据获取模块 GAM模型 注意力 数据处理模块 可变形卷积层 特征提取能力 字段 可读存储介质 开源框架 分割系统 多层感知机 处理器 坐标 文本
系统为您推荐了相关专利信息
1
一种基于时序大模型的指标数据预测方法与相关装置
数据预测方法 交叉注意力机制 大语言模型 线性变换矩阵 时间序列预测技术
2
一种用于肺结节分割的多模态时空网络模型及其分割方法
文本特征向量 时空融合特征 局部空间特征 特征提取模块 注意力机制
3
一种电池温度的估计方法、终端设备以及存储介质
热耦合模型 电池 多层感知机 估计方法 终端设备
4
结合注意力机制与体素特征聚合的三维目标检测方法
三维点云数据 注意力机制 协同注意力 全局平均池化 关键点特征
5
一种基于注意力机制的跨模态哈希检索方法
矩阵 哈希检索方法 注意力机制 文本特征值 图像特征值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号