摘要
本发明公开了一种基于元强化学习的无人机集群抗干扰通信方法,该方法为:构建无人机集群抗干扰通信环境,初始化网络参数,生成多个元强化学习任务;从元训练集抽样任务,初始化环境、经验池、上下文采样池;各无人机将与环境交互的观测数据输入至用于上下文任务推理的编码器和长短期记忆网络模块,得到上下文任务信息和历史记忆,将其与智能体的当前观测拼接,作为双深度递归Q网络即DDRQN的输入,预测动作并与环境交互;最后判断环境是否达到最大训练步长,若达到则结束当前回合,进入元测试阶段;否则重复进行下一轮的训练。本发明具有可扩展性强、泛化性能强、学习效率高、稳定性强、传输能量损耗低、跳频开销少、网络寿命长的优点。
技术关键词
抗干扰通信方法
无人机集群
长短期记忆网络
采样池
构建无人机
编码器
抗干扰通信装置
通信信道
训练集
参数
强化学习框架
推理网络
损耗
模块
功率
系统为您推荐了相关专利信息
数据处理系统
智能分析模块
配网
大规模分布式网络
分布式数据库架构
早期预测方法
果蝇优化算法
长短期记忆网络
决策树模型
数据
快速检测方法
原始图像数据
训练集数据
构建无人机
深度特征融合
模糊逻辑算法
火灾预警方法
长短期记忆网络
一氧化碳
异常数据
大规模无人机
拍卖算法
数学模型
构建无人机
无人机集群