摘要
本发明属于信息数据处理的技术领域,更具体地,涉及基于知识蒸馏解决遗忘学习灾难性回忆的方法及装置。所述方法包括选择初始模型并使用标准数据集训练,通过最小化交叉熵损失优化初始模型参数;选定目标遗忘类别,应用类遗忘方法调整模型参数,生成对目标遗忘类别识别能力低,对其他类别识别准确率高的遗忘模型;从原始数据集中选择剩余的类别数据作为增量学习数据并加入定量的目标遗忘类别数据作为输入数据,以生成的遗忘模型为教师模型,初始化学生模型,学生模型在输入数据上通过知识蒸馏损失约束输出分布,更新学生模型的参数。本发明解决了被遗忘模型在增量学习过程中无法保持遗忘性能,在吸收新信息时可能会出现灾难性遗忘的问题。
技术关键词
数据
蒸馏
学生
参数
教师
样本
神经网络架构
标签
可读存储介质
处理器
学习方法
定义
优化器
计算机
语义
索引
存储器
编码
阶段
图像
系统为您推荐了相关专利信息
情感分析方法
多模态信息
权重分配机制
跨模态
文本
注塑机械手
果蝇优化算法
姿态控制方法
关节
姿态控制技术
水工隧洞
高斯扩散模型
预报方法
监测气体浓度
紫外光谱技术
心血管参数
人工心脏
指标
血流动力学参数
心血管模型