摘要
本发明公开了一种文本图像识别模型训练方法及文本图像识别方法,应用于文本图像识别领域,将文本图像样本输入文本识别模型进行裁剪得到多个裁剪图像;对各裁剪图像进行特征提取得到对应的局部特征,将局部特征按照裁剪顺序进行复原得到复原图像;基于自注意力机制提取复原图像在不同维度的全局特征,将全局特征进行特征融合得到融合特征;对融合特征进行分析识别得到文字识别结果,基于文本识别结果确定模型损失值更新模型参数得到训练完成的文本识别模型。通过提取图像的局部特征及全局特征进行模型训练,无需分别训练特征提取模型和序列模型,在全局特征提取的过程中引入自注意力机制,自注意力机制支持并行运算,提高了训练及识别效率。
技术关键词
文本识别模型
文本图像识别
融合特征
文本识别方法
注意力机制
矩阵
更新模型参数
模型训练方法
矫正模型
计算机可执行指令
训练特征提取模型
卷积模块
样本
全局特征提取
可读存储介质
训练装置
系统为您推荐了相关专利信息
集成神经网络
信息采集模块
分析模块
流媒体业务平台
鼠标
海上风电并网系统
概率预测方法
时序
多头注意力机制
海上风电场
注意力机制
编码器结构
特征选择
阈值小波变换
预测建模
石油设备
故障预测方法
振动传感器
电流传感器
因子