摘要
本发明涉及字符识别技术领域,更进一步地,涉及基于深度学习的OCR错漏检测方法。所述方法包括:步骤1:对目标文本图像进行预处理,得到预处理图像;步骤2:使用卷积神经网络从预处理图像中提取特征;将提取的特征输入递归神经张量网络进行特征表示学习,输出每个时刻的隐藏状态;步骤3:使用条件随机场对递归神经张量网络输出的隐藏状态进行序列标注;步骤4:针对检测出的错漏位置,使用贝叶斯方法进行校正,输出校正的错漏位置。本发明提高了系统的错漏检测和校正能力,增强了系统在处理复杂和多变文本数据时的鲁棒性和适应性。
技术关键词
条件随机场
非线性图像增强
梯度提升模型
序列
文本
贝叶斯方法
标签
噪声抑制技术
字符识别技术
矩阵
广义
双曲正切函数
校正
网络
元素
参数
融合特征
多尺度