基于自蒸馏算法优化的MAAC多目标跟踪方法

正文

推荐专利

申请号：CN202510302282

申请日期：2025-03-14

公开号：CN120219434B

公开日期：2026-01-02

类型：发明专利

摘要

本发明公开了基于自蒸馏算法优化的MAAC多目标跟踪方法，包括：将智能体与环境进行交互，生成交互经验回放，利用结构相同的教师网络和学生网络通过双策略循环模式进行学习，完成有限视野智能体的多目标跟踪；其中，双策略循环模式为所述教师网络通过与环境交互生成高误差和高回报经验，训练集中式评论家网络并指导行动家网络更新；所述学生网络在蒸馏阶段通过平滑L1损失和逆KL散度学习所述教师网络的价值函数与动作分布，最终覆盖教师网络参数实现多目标跟踪优化。设计了独立的教师策略目标评论家网络，在训练过程中不参与循环覆盖，采用了特殊损失函数设计，加速了学生网络的收敛过程并有效提升了策略的优化效果。

技术关键词

跟踪方法教师网络蒸馏学生算法时序损失函数设计参数误差策略更新模式阶段视野因子机制样本决策线性

系统为您推荐了相关专利信息

一种基于Ros架构的自适应调参的自动焊接方法

焊接工艺参数自动焊接方法 BP神经网络图像处理算法焊缝特征点位置

一种高空间分辨率遥感影像建筑物提取方法

建筑物提取方法分辨率遥感影像注意力特征提取能力全局平均池化

一种电力计量设备异常运行状态检测方法

电力计量设备状态检测方法交互注意力节点矩阵

一种基于改进YOLOv8的轻量化船舶检测方法

船舶检测方法双向特征金字塔数据特征提取网络障碍物

一种基于事件数据驱动的模糊视频超分辨率方法

视频超分辨率对齐模块事件特征序列矩阵

基于自蒸馏算法优化的MAAC多目标跟踪方法

站点导航

APP 下载