摘要
本发明涉及人工智能技术领域,具体提供一种大型语言模型的训练方法、系统、设备及存储介质,包括:基于任务难度和任务多样性需求采集任务样本;获取任务样本的支持集和查询集,并对支持集进行数据增强处理;利用支持集对元模型进行内循环训练,并利用查询集对经过内循环训练的元模型进行外循环训练,得到元梯度;汇总元梯度,利用自适应优化器基于元梯度汇总数据更新全局模型。本发明提升了大型语言模型对任务类型的适应能力。
技术关键词
数据更新
优化器
代表
样本
词语
可读存储介质
人工智能技术
训练设备
训练系统
采样模块
程序
同义词
计算方法
参数
处理器
偏差
频率
文本
系统为您推荐了相关专利信息
实测实量
机器人控制方法
图像智能识别
全景相机
数字孪生
状态估计模型
错误率
评价量表
支持向量机模型
负荷
医疗辅助诊断方法
卷积神经网络模型
医学影像数据
电子病历
正则化方法