知识蒸馏方法、电子设备及计算机可读存储介质

AITNT
正文
推荐专利
知识蒸馏方法、电子设备及计算机可读存储介质
申请号:CN202511071909
申请日期:2025-07-31
公开号:CN120611768B
公开日期:2025-10-31
类型:发明专利
摘要
本申请公开了一种知识蒸馏方法、电子设备及计算机可读存储介质,涉及人工智能技术领域,包括通过基于学生网络的初始网络结构中注意力头的数量对教师网络的注意力图矩阵进行分组,能够将教师网络高维注意力空间划分为与学生网络同维度的子空间,通过对组内的注意力图矩阵进行拼接,使每组拼接矩阵与初始网络结构的注意力头形成对齐,实现教师网络与学生网络注意力图之间较为规整的对应关系,从而能够计算蒸馏损失,实现将复杂教师网络的知识准确传递给轻量级学生网络。因此,可以解决多头注意力机制中教师网络与学生网络头数的差异,阻碍学生网络对教师网络知识的充分学习的问题,达到提高知识蒸馏效果,增强学生网络性能的技术效果。
技术关键词
网络结构 矩阵 知识蒸馏方法 教师 学生 预训练模型 传播算法 可读存储介质 多头注意力机制 电子设备 存储计算机程序 人工智能技术 策略 元素 超参数
系统为您推荐了相关专利信息
1
一种光纤测试对中装置及方法
光路切换单元 光电转换单元 深度卷积神经网络算法 准直透镜 单模光纤
2
一种基于多轴级的智能仓储管理方法及系统
智能仓储管理方法 LSTM模型 库存周转率 三维网格单元 分区
3
一种基于目标识别的移动机器人自主定位导航方法及装置
移动机器人 自主定位导航方法 实时图像 特征点 序列
4
一种基于鱼眼相机的NLOS信号处理方法与系统
鱼眼相机 信号处理方法 协方差矩阵 图像分割 航向角信息
5
一种高压旋喷成桩三维形态的实时动态预测系统及方法
传感器监测网络 动态预测方法 高压旋喷施工 深度学习预测模型 演化特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号