摘要
本发明公开了一种端到端的票据识别方法和装置。其方法包括:对输入的票据图像进行包括去噪、灰度化、倾斜校正的预处理操作;采用改进的YOLOv5对预处理后的票据图像中的文本目标进行定位检测获取票据文本区域;改进的YOLOv5将分层的类残差连接应用到YOLOv5的多尺度特征提取模块C3中,同时将YOLOv5的多尺度特征连接方式由路径聚合网络PANet改进为双向特征金字塔网络BiFPN;采用改进的卷积循环神经网络CRNN算法对定位到的票据文本区域进行文本识别,输出识别的票据文本内容;改进的CRNN算法采用ResNet残差网络作为特征提取模块,并在ResNet的残差块间引入包括通道和空间两个维度的注意力模块。本发明方案可以实现多种类型票据图像的智能识别,检测速度快,识别精度高。
技术关键词
双向特征金字塔
特征提取模块
注意力
卷积循环神经网络
票据识别方法
残差网络
池化特征
文本识别
通道
支路
票据识别装置
算法
图像
特征融合网络
分层
系统为您推荐了相关专利信息
故障预测方法
设备剩余使用寿命
电气设备绝缘电阻
概率密度函数
异常检测器
特征提取能力
通道注意力机制
特征提取网络
多层次特征提取
多尺度特征融合
电力柜
综合监测系统
多传感器
电磁干扰数据
电磁环境数据
图像分割方法
交互特征
多尺度特征学习
编码器模块
神经网络模型训练
电力自助终端
文本
长短记忆神经网络
查询意图
意图识别方法