一种基于样本回放的大模型连续知识迁移方法

AITNT
正文
推荐专利
一种基于样本回放的大模型连续知识迁移方法
申请号:CN202510633852
申请日期:2025-05-16
公开号:CN120806050A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开的一种基于样本回放的大模型连续知识迁移方法,属于大语言模型持续学习技术领域,应用于大模型连续学习场景中。本发明实现方法为:1、利用最大似然估计的大语言模型对单一子任务样本结构数据进行训练;2、利用Rouge‑L指标筛选单一子任务中高于阈值的样本数据存入记忆池中;3、通过回放记忆池中的数据,在多任务上对大语言模型进行迭代指令微调;与现有技术相比,本发明通过基于模型的样本回放的大模型连续学习,降低了缓解大语言模型灾难性遗忘方法的复杂性并将模型当前状态及其对特定任务的掌握程度融入数据回放,通过数据配比和回放记忆池中的样本增强了大语言模型的稳定性。
技术关键词
知识迁移方法 大语言模型 样本 多任务 记忆 存储设备 数据存储 指令 指标 格式化 序列 计算机 场景 关系
系统为您推荐了相关专利信息
1
剧本处理方法、装置、电子设备及存储介质
大语言模型 标识 摘要 通信接口 电子设备
2
基于航拍数据智能分割识别的地理信息模型构建方法及计算机程序产品
地理信息模型 航拍 计算机程序产品 图像 融合知识图谱
3
震感信息融合专报生成方法、装置、电子设备和存储介质
地震 生成方法 大语言模型 模板 坐标
4
基于人工智能的异常数据识别方法、装置、设备及介质
异常数据 可视化界面 神经网络算法 识别方法 语义
5
应用于电子工程中高Sigma场景的失效区域评估方法
区域评估方法 样本 高风险 建立预测模型 场景
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号