摘要
本发明公开了一种基于强化学习改进的多无人机目标追捕方法,包括以下步骤:S1.对追捕问题进行建模;S2.构建训练网络框架,采用多级课程学习方式完成追捕策略的训练,得到训练好的智能体;S3.将当前追捕无人机的观测空间输入至训练好的策略网络,获取对应的追捕策略,完成目标物的追捕。
技术关键词
动态障碍物
人工势场法
坐标
策略网络模型
对抗网络模型
参数
实时状态信息
决策
斥力势场
速度
控制无人机
生成动作
策略更新
估计方法
控制策略
系统为您推荐了相关专利信息
光伏跟踪支架
光伏组件模型
光照
太阳光
数据管理模块
融合定位方法
滑动窗口
队列
GNSS数据处理
激光雷达点云数据
关键点
机电设备
坐标转换算法
资产定位方法
指针
振动传感器
健康预警方法
数据
机械系统
预警模型