摘要
本发明公开的一种基于样本回放的大模型连续知识迁移方法,属于大语言模型持续学习技术领域,应用于大模型连续学习场景中。本发明实现方法为:1、利用最大似然估计的大语言模型对单一子任务样本结构数据进行训练;2、利用Rouge‑L指标筛选单一子任务中高于阈值的样本数据存入记忆池中;3、通过回放记忆池中的数据,在多任务上对大语言模型进行迭代指令微调;与现有技术相比,本发明通过基于模型的样本回放的大模型连续学习,降低了缓解大语言模型灾难性遗忘方法的复杂性并将模型当前状态及其对特定任务的掌握程度融入数据回放,通过数据配比和回放记忆池中的样本增强了大语言模型的稳定性。
技术关键词
知识迁移方法
大语言模型
样本
多任务
记忆
存储设备
数据存储
指令
指标
格式化
序列
计算机
场景
关系
系统为您推荐了相关专利信息
地理信息模型
航拍
计算机程序产品
图像
融合知识图谱
异常数据
可视化界面
神经网络算法
识别方法
语义