一种文本图像识别模型训练方法及文本图像识别方法

AITNT
正文
推荐专利
一种文本图像识别模型训练方法及文本图像识别方法
申请号:CN202510595103
申请日期:2025-05-09
公开号:CN120451993A
公开日期:2025-08-08
类型:发明专利
摘要
本发明公开了一种文本图像识别模型训练方法及文本图像识别方法,应用于文本图像识别领域,将文本图像样本输入文本识别模型进行裁剪得到多个裁剪图像;对各裁剪图像进行特征提取得到对应的局部特征,将局部特征按照裁剪顺序进行复原得到复原图像;基于自注意力机制提取复原图像在不同维度的全局特征,将全局特征进行特征融合得到融合特征;对融合特征进行分析识别得到文字识别结果,基于文本识别结果确定模型损失值更新模型参数得到训练完成的文本识别模型。通过提取图像的局部特征及全局特征进行模型训练,无需分别训练特征提取模型和序列模型,在全局特征提取的过程中引入自注意力机制,自注意力机制支持并行运算,提高了训练及识别效率。
技术关键词
文本识别模型 文本图像识别 融合特征 文本识别方法 注意力机制 矩阵 更新模型参数 模型训练方法 矫正模型 计算机可执行指令 训练特征提取模型 卷积模块 样本 全局特征提取 可读存储介质 训练装置
系统为您推荐了相关专利信息
1
基于人工智能的视频异常识别处理方法及系统
关键帧 图像识别模型 运动特征 融合特征 光流场
2
一种基于大数据模型的金融业务风控管理系统
集成神经网络 信息采集模块 分析模块 流媒体业务平台 鼠标
3
基于离散化的海上风电并网系统状态概率预测方法及装置
海上风电并网系统 概率预测方法 时序 多头注意力机制 海上风电场
4
基于趋势分解和改进Transformer编码器的PM2.5预测方法
注意力机制 编码器结构 特征选择 阈值小波变换 预测建模
5
一种基于大数据的石油设备故障预测方法及系统
石油设备 故障预测方法 振动传感器 电流传感器 因子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号