重建引导的多模态大模型训练方法、装置、应用及设备

正文

推荐专利

申请号：CN202411652971

申请日期：2024-11-19

公开号：CN119692463A

公开日期：2025-03-25

类型：发明专利

摘要

本发明提供了一种重建引导的多模态大模型训练方法、装置、应用、设备、介质及程序产品。该方法包括：对样本图像进行重建，得到重建图像特征；将针对样本图像的样本视觉特征和针对样本文本的样本文本特征输入多模态大模型，输出预测视觉特征和预测文本特征，其中，样本文本与样本图像关联；基于重建图像特征和预测视觉特征，确定重建引导的视觉损失值；基于预测文本特征和样本文本特征，确定文本损失值；以及基于重建引导的视觉损失值和文本损失值，对多模态大模型进行训练，得到训练好的多模态大模型。

技术关键词

视觉特征文本样本模型训练方法多模态随机噪声模型训练装置像素点图像重建处理器模块程序标签电子设备存储器颜色介质

系统为您推荐了相关专利信息

基于度量的元学习视频行为识别方法

视频原型度量识别方法语义

基于多模态数据融合的全周期智能管理系统及方法

多模态数据融合状态监测数据智能管理系统训练集决策

一种信贷风险预测方法、装置、设备及存储介质

贝叶斯网络模型马尔科夫模型客户风险评估报告朴素贝叶斯分类器

系统评估方法、装置和计算机设备

系统评估方法生成系统数据训练样本集规则集

一种用于高含沙量水源地中新污染物的辩识方法及系统

同位素示踪法玻璃纤维滤膜氯化钙溶液有机玻璃泥沙

重建引导的多模态大模型训练方法、装置、应用及设备

站点导航

APP 下载