摘要
本发明公开了一种基于协同强化学习的多无人机轨迹规划和数据收集方法,包括:建立无人机与基站间通信的信道模型和数据收集模型,提出多无人机时断时续信息共享模型,多无人机时断时续信息共享模型包括地图状态信息共享子模型和历史经验信息共享子模型;基于多智能体双深度Q网络算法,无人机在有限资源下对动态环境的信息获取不全时,将自身的观测值输入到神经网络拟合的策略函数中并根据其他无人机的协同信息交互,输出动作并获得相应的奖励,完成与环境和其他无人机的交互。本发明能够保障无人机在复杂地形或者恶意干扰隔断机间协同共享时,也能顺利完成轨迹规划和数据收集。
技术关键词
无人机轨迹规划
数据收集方法
信息共享模型
多无人机
深度Q网络
地图
设计无人机
保障无人机
无人机协同
恶意干扰
无人机系统
网格
感兴趣
策略
基站
状态更新
系统为您推荐了相关专利信息
多参数
时域电磁法
神经网络结构模型
神经网络参数
梯度下降算法
区块链平台
需求预测模型
产能
物联网传感器
深度强化学习算法
深度强化学习
加权损失函数
时序依赖关系
两阶段
深度Q网络
空气质量智能监测
净化方法
人体生物节律
云端管理平台
动态
会议终端设备
音频同步方法
资源分配策略
通信资源分配
深度Q网络