摘要
本发明涉及发票识别技术领域,尤其是涉及一种发票文本信息识别方法及系统。包括构建基于ParameterNet的动态卷积的YOLOv8模型,将所述ParameterNet中的动态卷积引入主干网络和颈部网络中的C2f模块,以增强YOLOv8模型的特征提取能力;在每一检测头引入部分卷积策略,以降低模型检测头的计算复杂度,根据训练样本对YOLOv8模型进行训练以输出文本区域;构建包括TPS的STN和基于单视觉模型的SVTR,根据STN以矫正识别数据集的形状,通过增加所述局部混合在SVTR中的数量占比以增强局部特征感知能力以及文本信息捕捉能力,最终输出结构化的发票文本信息。本发明增强模型的表达能力,提高文本检测能力及识别效率,增强了模型的局部特征感知能力以及文本信息捕捉能力。
技术关键词
文本信息识别方法
场景文本识别网络
空间变换网络
文本识别模型
混合模块
薄板样条插值
特征提取能力
动态卷积网络
检测头
视觉
矫正
图像
发票识别技术
计算机存储介质
输出特征
多层感知机