摘要
本公开提供了一种文本识别方法、装置及存储介质,涉及文本识别技术领域,该方法包括:获取含有待识别文本的目标图像;确定所述目标图像中待识别文本的拉伸系数;基于所述拉伸系数,对所述目标图像进行拉伸还原,得到所述目标图像对应的还原图像;对所述还原图像进行文本识别,得到所述待识别文本。该方法通过对目标图像进行拉伸还原,恢复文本的原始比例和形状,有效消除因图像拉伸导致的字符变形和间距不均,从而显著提高文本识别的准确性;并且,通过确定拉伸系数并进行还原处理,可以在预处理阶段解决图像变形问题,使得后续的文本识别算法能够在更标准的图像条件下进行处理,简化整体识别流程和算法复杂程度,提高处理效率。
技术关键词
图像
文本识别方法
混合模块
前馈神经网络
归一化模块
机器可读指令
文本识别技术
文本识别装置
注意力
处理器
可读存储介质
电子设备
存储器
识别模块
计算机
算法
数据
系统为您推荐了相关专利信息
飞行器
协同分配方法
非易失性计算机可读存储介质
计算机程序指令
关系
多尺度特征
编码器
分支
多层次
图像语义分割装置