摘要
本申请涉及一种文本识别方法及装置,所述方法包括:获取待识别文本图像;对所述待识别文本图像进行特征提取,得到所述待识别文本图像的初始特征图;对所述初始特征图进行特征通道扩展处理,将所述初始特征图扩展为多通道特征图;从所述多通道特征图中提取出所述待识别文本图像的高级特征;根据所述高级特征确定所述待识别文本图像中包括的文本字符。基于该方法可以构建出轻量化的文本识别模型,从而使得文本识别模型可以进行本地化部署,满足用户对文本识别模型的本地化部署需求。
技术关键词
多通道特征
文本识别模型
训练样本图像
子模块
扩展模块
文本识别方法
特征提取网络
卷积模块
注意力
特征提取模块
文本识别装置
图像增强
字符
参数