摘要
本发明涉及深度学习模型压缩与优化技术领域,尤其涉及一种增强知识蒸馏方法、系统及存储介质。所述方法包括:获取目标类别和非目标类别,并将所述非目标类别划分为混淆类别和非混淆类别;对混淆类别和非混淆类别进行损失计算,将得到的混淆类别知识蒸馏损失和非混淆类别知识蒸馏损失的加权和作为非目标类别知识蒸馏损失;对全部类别进行全局稀疏预测并进行损失计算,将目标类别知识蒸馏损失、非目标类别知识蒸馏损失和全局稀疏预测知识蒸馏损失的加权和作为增强知识蒸馏的综合损失;通过迭代训练最小化综合损失,实现增强知识蒸馏。旨在解决现有知识蒸馏方法在处理非目标类别时未充分考虑类别间相似性以及缺乏冗余信息去除的技术问题。
技术关键词
知识蒸馏方法
蒸馏系统
深度学习模型压缩
切比雪夫
学生
教师
分配单元
矩阵
表达式
可读存储介质
处理单元
传播算法
模块
参数
样本
频率
计算机
程序
冗余
系统为您推荐了相关专利信息
检测模型训练方法
节点
检测终端
LSTM模型
强化学习模型
虚拟系统
输入模块
后处理模块
电数字数据处理技术
编码模块
多任务学习网络
程度评估方法
多通道脑电信号
Inception网络
损失函数优化
信息交互方法
教学
语言教材
语音
计算机程序产品