模型训练、图文识别方法、装置、电子设备和存储介质

AITNT
正文
推荐专利
模型训练、图文识别方法、装置、电子设备和存储介质
申请号:CN202411940447
申请日期:2024-12-26
公开号:CN119741501A
公开日期:2025-04-01
类型:发明专利
摘要
本发明提供一种模型训练、图文识别方法、装置、电子设备和存储介质,其中方法包括:基于初始识别模型的视觉分支和语义分支,分别提取样本图像的视觉特征和语义特征;基于字符一致但排序不同的多个样本图像的视觉特征之间的差异,确定视觉约束损失;基于语义一致的多个样本图像的语义特征之间的差异,和/或,语义相近的多个样本图像的语义特征之间的差异,确定语义约束损失;基于视觉约束损失,对视觉分支进行参数迭代,以及,基于语义约束损失,对语义分支进行参数迭代,基于参数迭代完成后的初始识别模型,确定训练完成的图文识别模型。本发明提供的方法、装置、电子设备和存储介质,保证了复杂场景下图文识别的语义合理性和识别准确性。
技术关键词
语义特征 模型训练方法 图文识别方法 视觉特征 图像 样本 分支 字符 图文识别装置 非暂态计算机可读存储介质 编码器 参数 电子设备 模型训练装置 特征提取单元 蒸馏 处理器
系统为您推荐了相关专利信息
1
一种玻璃缺陷检测方法及系统
玻璃缺陷检测方法 图像 玻璃缺陷检测系统 数据 初始聚类中心
2
一种三维插图的显示方法、装置及存储介质
网格 顶点 物体 颜色 绘制三维模型
3
基于国产大幅面彩色绘图仪的数据高速处理方法
光栅化图像 绘图仪 分块 打印驱动程序 图像数据处理
4
一种基于耕种深度动态补偿的旋耕机
状态分布图 图像识别模块 分析模块 动态 旋耕深度
5
码流融合方法、芯片、NVR、服务器、网络及存储介质
网络视频录像机 融合服务器 设备组 网络摄像机 像素点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号