摘要
本发明提出了一种基于混合奖励机制和自适应调整驱动的多无人机动态目标覆盖方法,属于无人机的智能自主协同控制领域。对多无人机动态目标覆盖任务进行系统建模,包括建立无人机的运动学模型以及动态目标选择模型;将多无人机动态目标覆盖建模为马尔科夫决策过程,包括设计无人机的状态空间、动作空间以及奖励函数;通过将无人机覆盖建模为马尔科夫决策过程,设计自适应学习函数,使用TSA‑MADDPG算法对无人机进行训练,得到无人机的动态目标覆盖策略模型,利用该策略模型部署与控制无人机以完成动态目标覆盖任务。多无人机相互合作形成多智能体系统,可以充分弥补单无人机的缺陷,更能够在复杂和多任务的场景中工作。
技术关键词
动态
设计无人机
机制
笛卡尔坐标系
控制无人机
无人机飞行速度
代表
策略
多智能体系统
引导无人机
决策
网络
多无人机
算法
多任务
参数
阻尼
因子
系统为您推荐了相关专利信息
太赫兹超材料
反向设计方法
传感器结构
生成式网络
超材料传感器
样本
信号编码器
信号处理
振动信号分类方法
模型构建方法
导航算法
导航定位方法
信号
卡尔曼滤波融合
导航定位装置
模型训练方法
视频
广告
搜索引擎平台
接收图文数据