摘要
本申请公开了一种多模态基础模型迁移方法及系统,运用于迁移学习技术领域,其方法包括:获取输入图像和文本类别;提取输入图像的视觉特征以及文本类别中的文本特征;基于视觉特征和文本特征分别计算第一损失和第二损失;计算输入图像相对于所述文本类别的预测分数,进而聚合得到混合分数向量;计算输入图像在文本类别上的提示分数向量;计算提示分数向量和混合分数向量之间的第三损失,计算预设的多模态基础模型对输入图像的预测分数向量和真实样本标签的交叉熵损失;基于第一损失、第二损失、第三损失、交叉熵损失,得到迁移框架,通过迁移框架将外部异构知识集成至多模态基础模型中。
技术关键词
模型迁移方法
视觉特征
多模态
图像生成模型
基础
文本编码器
迁移学习技术
框架
标志
异构
大语言模型
标签
处理器
样本
存储器
程序
网络
系统为您推荐了相关专利信息
火箭
轨迹预测模型
智能监控模块
历史轨迹数据
推力
芯片封装
监控方法
卷积网络模型
控制终端
压电式压力传感器
预训练模型
事件定位方法
混合损失函数
背景补偿
适配器