摘要
本申请提供一种多模态大模型的知识蒸馏方法、系统、设备及存储介质,涉及人工智能技术领域,方法包括:将用户端发送的多模态数据输入至视觉模态解析单元、语言模态解析单元及语音模态解析单元,对应生成视觉特征向量、语言特征向量及语音特征向量;并进行特征融合,生成融合特征矩阵;在融合特征矩阵的基础上,将教师模型的知识迁移至学生模型;获取学生模型输出的预测结果,将预测结果反馈至用户端,并接收用户端发送的反馈信息;将反馈信息存入动态记忆库中,基于动态记忆库中存储的梯度方向向量,对学生模型进行增量学习。本申请具有的技术效果是:根据用户的实际使用情况进行动态优化,以使模型性能满足实际应用需求。
技术关键词
知识蒸馏方法
解析单元
多模态
融合特征
学生
语音
联合损失函数
视觉
教师
记忆
硬件平台
动态
注意力
矩阵
网络接口
数据
存储模块
分片
蒸馏系统
人工智能技术
系统为您推荐了相关专利信息
路径损耗数据
神经网络架构
编解码器
构建预测模型
场景
量化评估方法
多模态
图谱
动态场景信息
驾驶风格分类
软件漏洞检测方法
软件漏洞检测系统
融合特征
软件程序产品
程序依赖图
荧光染色法
控制评价方法
酒精
活性氧
电化学生物传感器