摘要
本申请涉及一种基于表征偏移约束的大模型持续学习方法、装置和设备。所述方法包括:获取预训练的大模型和当前的新增领域数据;采用预先设置的持续学习策略、原始领域数据以及新增领域数据对预训练的大模型进行持续学习,获取各预设阶段训练好的大模型;获取包含多个探测任务集的探测任务集集合,采用预训练的探针分类器在各探测任务集上对当前阶段训练好的大模型进行探测,根据当前阶段和上一阶段的探测结果计算得到偏移损失,根据各预设阶段间的偏移损失和持续学习损失得到总损失,当总损失收敛时,停止持续学习,得到领域增强的大模型;利用领域增强的大模型在领域中进行内容生成。采用本方法能够提高模型生成内容的可靠性。
技术关键词
持续学习方法
分类器
阶段
数据
自然语言
蒸馏方法
探针
语义
多层感知机
学习装置
序列
参数
摘要
计算机设备
模块
文本
存储器
处理器
样本