摘要
本公开提供了一种模型训练方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型、图像处理、多模态信息处理等技术领域。具体实现方案为:将第一样本图像输入第一视觉编码器,以将第一样本图像映射到连续的潜在空间,得到中间特征;将中间特征输入待训练视觉编码器得到待优化视觉特征;基于待优化视觉特征确定第一训练损失;基于第一训练损失,优化待训练视觉编码器,以得到包括第一视觉编码器和第二视觉编码器的连续视觉编码器;第二视觉编码器为训练收敛的待训练视觉编码器。
技术关键词
大语言模型
语义向量
视觉特征
多模态
降维特征
模型训练方法
图像
样本
输出特征
特征提取模块
教师
模型训练装置
文本编码器
处理器
人工智能技术
噪声信息
解码器
计算机
系统为您推荐了相关专利信息
能力开放方法
多模态网络
模块
通信设备
可读存储介质
情感分析方法
生成技术
多模态情感分析
数据
检索算法