摘要
本申请公开了一种全模态大模型的训练方法、装置、设备及介质,涉及模型训练领域,该方法包括:采用经验回放池存储旧任务的样本数据;其中,旧任务为全模态大模型已经学习过的任务,样本数据包括多种模态的数据;当全模态大模型学习新任务时,根据新任务的样本数据及经验回放池中存储的旧任务的样本数据,对全模态大模型进行多轮训练,并在训练过程中根据全模态大模型在旧任务的样本数据上的准确率,动态调整新任务的样本数据与旧任务的样本数据的比例,以得到联合训练后的全模态大模型。本申请解决了全模态大模型的灾难性遗忘问题,提高了全模态大模型的长期记忆能力,确保其在不断学习新任务的过程中保持高性能。
技术关键词
样本
智能问答系统
执行语音识别
生成自然语言
文本
训练装置
图像
数据存储模块
处理器
计算机设备
动态
可读存储介质
多模态
存储器
高性能
记忆
分层
系统为您推荐了相关专利信息
智能检测方法
更新模型参数
梯度下降算法
组织
预测输出值
调制信号分类
时序
状态空间模型
分类方法
机器可读指令