模型训练、图文识别方法、装置、电子设备和存储介质

正文

推荐专利

申请号：CN202411940447

申请日期：2024-12-26

公开号：CN119741501A

公开日期：2025-04-01

类型：发明专利

摘要

本发明提供一种模型训练、图文识别方法、装置、电子设备和存储介质，其中方法包括：基于初始识别模型的视觉分支和语义分支，分别提取样本图像的视觉特征和语义特征；基于字符一致但排序不同的多个样本图像的视觉特征之间的差异，确定视觉约束损失；基于语义一致的多个样本图像的语义特征之间的差异，和/或，语义相近的多个样本图像的语义特征之间的差异，确定语义约束损失；基于视觉约束损失，对视觉分支进行参数迭代，以及，基于语义约束损失，对语义分支进行参数迭代，基于参数迭代完成后的初始识别模型，确定训练完成的图文识别模型。本发明提供的方法、装置、电子设备和存储介质，保证了复杂场景下图文识别的语义合理性和识别准确性。

技术关键词

语义特征模型训练方法图文识别方法视觉特征图像样本分支字符图文识别装置非暂态计算机可读存储介质编码器参数电子设备模型训练装置特征提取单元蒸馏处理器

系统为您推荐了相关专利信息

一种玻璃缺陷检测方法及系统

玻璃缺陷检测方法图像玻璃缺陷检测系统数据初始聚类中心

一种三维插图的显示方法、装置及存储介质

网格顶点物体颜色绘制三维模型

基于国产大幅面彩色绘图仪的数据高速处理方法

光栅化图像绘图仪分块打印驱动程序图像数据处理

一种基于耕种深度动态补偿的旋耕机

状态分布图图像识别模块分析模块动态旋耕深度

码流融合方法、芯片、NVR、服务器、网络及存储介质

网络视频录像机融合服务器设备组网络摄像机像素点

模型训练、图文识别方法、装置、电子设备和存储介质

站点导航

APP 下载