摘要
本申请公开了一种文本识别方法、电子设备以及存储介质。文本识别方法包括:利用文本识别模型获取至少一个初始图像特征,各初始图像特征分别是对待识别图像进行特征提取得到的;对各初始图像特征进行位置编码,得到各初始图像特征对应的位置查询向量;基于各初始图像特征和各位置查询向量,确定待识别图像的文本识别结果,文本识别结果中包括以下至少一者:待识别图像中各区域的类型、待识别图像中各区域的坐标信息以及待识别图像中各区域的字符信息。上述方案,能够提高文本识别得到的文本识别结果的准确度。
技术关键词
文本识别模型
融合特征
图像
文本识别方法
注意力
解码器
样本
字符
采样点
多尺度特征提取
模块
坐标
线性
电子设备
存储器
程序