摘要
本发明提供一种基于深度强化学习的异构无人机群分簇方法及系统,属于无线通信技术领域,所述方法包括:基于异构无人机群数据传输网络,创建与环境进行交互的多智能体深度强化学习网络,并初始化簇头智能体和簇成员智能体的奖励函数;获取簇头智能体的观察信息和可能动作,以及,簇成员智能体的观察信息和可能动作,以分别用于簇头智能体和簇成员智能体的策略模型训练;簇头智能体和簇成员智能体分别采用多智能体近端策略优化算法和独立近端策略优化方法训练策略模型;调用训练完成的策略模型,完成无人机群自主分簇。本发明优化了无人机数据传输网络的通信效能,提升了异构无人机群频谱共享的智能化和自动化水平。
技术关键词
异构无人机
数据传输网络
策略优化方法
深度强化学习算法
邻居
决策
非暂态计算机可读存储介质
策略更新
数据吞吐量
频谱共享
参数
无线通信技术
轨迹
处理器
中央控制
系统为您推荐了相关专利信息
调度优化方法
生成结构化数据
决策方法
评估算法
收集设备
邻居
分布式协同
状态空间模型
估计误差
定位方法
节点
小鼠
残差网络
聚类算法
Sigmoid函数
矿浆输送管
网优化方法
优化调度模型
深度强化学习
高压隔膜泵
监管云平台
前端采集设备
监管系统
数据传输网络
数据采集单元