基于表征偏移约束的大模型持续学习方法、装置和设备

正文

推荐专利

申请号：CN202411522518

申请日期：2024-10-29

公开号：CN119026668B

公开日期：2025-01-28

类型：发明专利

摘要

本申请涉及一种基于表征偏移约束的大模型持续学习方法、装置和设备。所述方法包括：获取预训练的大模型和当前的新增领域数据；采用预先设置的持续学习策略、原始领域数据以及新增领域数据对预训练的大模型进行持续学习，获取各预设阶段训练好的大模型；获取包含多个探测任务集的探测任务集集合，采用预训练的探针分类器在各探测任务集上对当前阶段训练好的大模型进行探测，根据当前阶段和上一阶段的探测结果计算得到偏移损失，根据各预设阶段间的偏移损失和持续学习损失得到总损失，当总损失收敛时，停止持续学习，得到领域增强的大模型；利用领域增强的大模型在领域中进行内容生成。采用本方法能够提高模型生成内容的可靠性。

技术关键词

持续学习方法分类器阶段数据自然语言蒸馏方法探针语义多层感知机学习装置序列参数摘要计算机设备模块文本存储器处理器样本

基于表征偏移约束的大模型持续学习方法、装置和设备

站点导航

APP 下载