一种基于样本回放的大模型连续知识迁移方法

正文

推荐专利

申请号：CN202510633852

申请日期：2025-05-16

公开号：CN120806050A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开的一种基于样本回放的大模型连续知识迁移方法，属于大语言模型持续学习技术领域，应用于大模型连续学习场景中。本发明实现方法为：1、利用最大似然估计的大语言模型对单一子任务样本结构数据进行训练；2、利用Rouge‑L指标筛选单一子任务中高于阈值的样本数据存入记忆池中；3、通过回放记忆池中的数据，在多任务上对大语言模型进行迭代指令微调；与现有技术相比，本发明通过基于模型的样本回放的大模型连续学习，降低了缓解大语言模型灾难性遗忘方法的复杂性并将模型当前状态及其对特定任务的掌握程度融入数据回放，通过数据配比和回放记忆池中的样本增强了大语言模型的稳定性。

技术关键词

知识迁移方法大语言模型样本多任务记忆存储设备数据存储指令指标格式化序列计算机场景关系

系统为您推荐了相关专利信息

剧本处理方法、装置、电子设备及存储介质

大语言模型标识摘要通信接口电子设备

基于航拍数据智能分割识别的地理信息模型构建方法及计算机程序产品

地理信息模型航拍计算机程序产品图像融合知识图谱

震感信息融合专报生成方法、装置、电子设备和存储介质

地震生成方法大语言模型模板坐标

基于人工智能的异常数据识别方法、装置、设备及介质

异常数据可视化界面神经网络算法识别方法语义

应用于电子工程中高Sigma场景的失效区域评估方法

区域评估方法样本高风险建立预测模型场景

一种基于样本回放的大模型连续知识迁移方法

站点导航

APP 下载