摘要
本发明涉及文本识别领域,提供了一种基于多属性监督的文本识别方法、装置及设备,该方法包括:获取待识别文本图像,对待识别文本图像进行预处理;对预处理后的待识别文本图像进行特征提取,得到共享图像特征;通过训练好的位置注意力解码器确定预处理后的待识别文本图像中的字符的位置特征;训练好的位置注意力解码器通过监督学习字符的位置信息得到;将共享图像特征输入第一时序特征提取模型,得到字典字库的分类结果;将共享图像特征和位置特征进行特征融合,将融合后的特征输入第二时序特征提取模型,得到相似属性字库的分类结果。本发明解决了现有技术中如何提高OCR模型在相似字符和复杂文本结构上的识别精度的问题,有效提升了文本相似字识别的性能。
技术关键词
文本识别方法
共享图像
特征提取模型
解码器
注意力
字典
字符
中文文本
非暂态计算机可读存储介质
特征提取模块
文本识别装置
时序特征
二值化算法
神经网络结构
处理器
训练集
计算机程序产品