基于多属性监督的文本识别方法、装置及设备

正文

推荐专利

申请号：CN202411645410

申请日期：2024-11-18

公开号：CN119810812A

公开日期：2025-04-11

类型：发明专利

摘要

本发明涉及文本识别领域，提供了一种基于多属性监督的文本识别方法、装置及设备，该方法包括：获取待识别文本图像，对待识别文本图像进行预处理；对预处理后的待识别文本图像进行特征提取，得到共享图像特征；通过训练好的位置注意力解码器确定预处理后的待识别文本图像中的字符的位置特征；训练好的位置注意力解码器通过监督学习字符的位置信息得到；将共享图像特征输入第一时序特征提取模型，得到字典字库的分类结果；将共享图像特征和位置特征进行特征融合，将融合后的特征输入第二时序特征提取模型，得到相似属性字库的分类结果。本发明解决了现有技术中如何提高OCR模型在相似字符和复杂文本结构上的识别精度的问题，有效提升了文本相似字识别的性能。

技术关键词

文本识别方法共享图像特征提取模型解码器注意力字典字符中文文本非暂态计算机可读存储介质特征提取模块文本识别装置时序特征二值化算法神经网络结构处理器训练集计算机程序产品

基于多属性监督的文本识别方法、装置及设备

站点导航

APP 下载