一种文本图像识别模型训练方法及文本图像识别方法

正文

推荐专利

申请号：CN202510595103

申请日期：2025-05-09

公开号：CN120451993A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种文本图像识别模型训练方法及文本图像识别方法，应用于文本图像识别领域，将文本图像样本输入文本识别模型进行裁剪得到多个裁剪图像；对各裁剪图像进行特征提取得到对应的局部特征，将局部特征按照裁剪顺序进行复原得到复原图像；基于自注意力机制提取复原图像在不同维度的全局特征，将全局特征进行特征融合得到融合特征；对融合特征进行分析识别得到文字识别结果，基于文本识别结果确定模型损失值更新模型参数得到训练完成的文本识别模型。通过提取图像的局部特征及全局特征进行模型训练，无需分别训练特征提取模型和序列模型，在全局特征提取的过程中引入自注意力机制，自注意力机制支持并行运算，提高了训练及识别效率。

技术关键词

文本识别模型文本图像识别融合特征文本识别方法注意力机制矩阵更新模型参数模型训练方法矫正模型计算机可执行指令训练特征提取模型卷积模块样本全局特征提取可读存储介质训练装置

系统为您推荐了相关专利信息

基于人工智能的视频异常识别处理方法及系统

关键帧图像识别模型运动特征融合特征光流场

一种基于大数据模型的金融业务风控管理系统

集成神经网络信息采集模块分析模块流媒体业务平台鼠标

基于离散化的海上风电并网系统状态概率预测方法及装置

海上风电并网系统概率预测方法时序多头注意力机制海上风电场

基于趋势分解和改进Transformer编码器的PM2.5预测方法

注意力机制编码器结构特征选择阈值小波变换预测建模

一种基于大数据的石油设备故障预测方法及系统

石油设备故障预测方法振动传感器电流传感器因子

一种文本图像识别模型训练方法及文本图像识别方法

站点导航

APP 下载