图像识别模型的训练方法及装置、电子设备和存储介质

正文

推荐专利

申请号：CN202510403935

申请日期：2025-04-01

公开号：CN120472258A

公开日期：2025-08-12

类型：发明专利

摘要

本公开公开了图像识别模型的训练方法及装置、电子设备和存储介质，涉及特征学习技术领域，主要技术方案包括：获取训练用问答数据；根据训练用问答数据及训练用图像数据对视觉通用模型进行训练，得到视觉通用模型生成的对训练用问答数据的预测答案；根据标准答案及预测答案计算视觉通用模型的损失函数，并根据损失函数对视觉通用模型进行参数调整。通过多种任务统一为问题‑答案数据对的方案，通过语言接口对多种视觉任务数据进行统一的训练，从而得到一种新的视觉通用模型，网络具有更好的视觉‑语言空间对齐能力，并且能够更好地处理和捕捉各种层级的视觉信息，能够有效提升主流多模态大语言模型的能力和效果。

技术关键词

视觉图像识别模型答案数据掩码矩阵令牌电子设备多层感知器多模态文本参数大语言模型对象识别计算机程序产品训练装置处理器通信指令

系统为您推荐了相关专利信息

一种洪水灾害预警方法及系统

灾害预警方法海绵设施汇水面积速率

一种用于鸟类洗澡盆的AI智能识别系统及方法

智能识别系统像素点洗澡盆图像扫描单元麦克风模组

核电厂设备的更换策略生成方法及装置

核电厂设备健康评估指标历史运行数据数字孪生体三维虚拟模型

基于高斯过程回归的齿轮泵滑动轴承性能预测方法

性能预测方法滑动轴承齿轮泵训练样本数据性能预测模型

一种山地生物多样性与水源涵养协同增效的高空间分辨率优化方法

水源涵养功能因子指数生物分辨率

图像识别模型的训练方法及装置、电子设备和存储介质

站点导航

APP 下载