基于多层次注意力的自我回顾知识蒸馏方法、系统及终端

正文

推荐专利

申请号：CN202411497725

申请日期：2024-10-25

公开号：CN119204164B

公开日期：2025-02-28

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了一种基于多层次注意力的自我回顾知识蒸馏方法、系统及终端。该方法利用学生模型和收敛后的教师模型，分别对样本集中的样本图片进行预测处理；获取教师模型和学生模型在每个处理阶段输出的特征图，据此计算教师模型和学生模型在每个处理阶段的注意力图。将学生模型在每个处理阶段的注意力图与前一处理阶段的注意力图进行特征融合，计算多层级注意力蒸馏损失。计算标准交叉熵损失和基本蒸馏损失；将三种损失加权得到总训练损失，据此进行梯度下降和反向传播，从而优化学生模型参数，随后利用样本集下一批次的样本图片对学习模型进行持续优化，直至学生模型收敛。本发明可有效提高学生模型的准确率。

技术关键词

注意力知识蒸馏方法学生教师阶段多层次样本图片层级处理单元融合特征计算机终端蒸馏系统人工智能技术模块标签处理器存储器参数

系统为您推荐了相关专利信息

基于GEE平台联合多源数据和双层集成模型的橡胶林提取方法

Stacking集成学习数据 Stacking集成模型训练机器学习模型特征选择

一种粉末冶金坯体烧结温度智能控制系统及方法

温度智能控制系统数据处理中心温度预测模型调节执行机构多源异构数据

协助者辅助计算的非完全重叠NOMA网络中通信与计算资源分配的联合优化方法

联合优化方法资源分配 MEC系统 SAC算法阶段

一种快递员配送事故智能取证方法及系统、电子设备

智能取证方法时空注意力机制配送终端语音情感分析识别快递员

一种基于水力模型的灌溉管网智能调度方法和系统

优化约束条件节点智能调度方法阶段拓扑图

基于多层次注意力的自我回顾知识蒸馏方法、系统及终端

站点导航

APP 下载