摘要
本发明属于水下多传感器目标跟踪技术领域,公开了一种基于深度强化学习的水下多无人平台协同跟踪方法及系统;其中,所述水下多无人平台协同跟踪方法包括:建立获得端到端的水下多无人平台调度算法;建立获得端到端的水下多无人平台数据融合算法;结合建模的马尔可夫决策过程模型,引入深度强化学习中的MAPPO算法同时对多平台调度策略、多平台数据融合策略进行学习,通过环境的反馈评估当前策略的有效性,最终确定当前环境下的最优跟踪策略。本发明能够在有效降低系统能耗的同时显著提升系统的任务执行效率和协同跟踪性能,可提升水下多无人平台在复杂水下目标跟踪环境中的应用性能和系统效率。
技术关键词
无人平台
协同跟踪方法
深度强化学习
数据融合算法
多平台数据融合
调度算法
融合策略
网络
决策
调度策略评估
梯度下降法
参数
策略更新
跟踪系统
有效性
系统为您推荐了相关专利信息
阻抗匹配优化
可变电容二极管
PCB基板结构
传输线特性阻抗
深度强化学习算法
深度强化学习
卸载方法
垂直起降飞行器
低空飞行器
资源分配
低空微型无人机
单目视觉图像
深度强化学习模型
模糊化方法
模糊核估计
卸载策略
强化学习模型
终端设备
卸载方法
任务调度服务器
医疗数据安全
保障方法
网络安全状态
深度强化学习算法
数据访问权限