摘要
本发明涉及一种基于多智能体深度强化学习的干扰功率分配方法,属于无线移动通信技术领域。本发明包括以下步骤:S1:在“多对多”通信对抗场景下,建立多干扰设备对抗多无人机目标的协同干扰模型;S2:构建分布式局部可观察马尔可夫决策过程(Dec‑POMDP),将干扰功率分配问题建模为多智能体完全协作模型;S3:设计“去中心化训练,分布式决策”(DTDE)多智能体框架,降低干扰功率资源的协同决策维度;S4:设计一提取器,对智能体输入状态信息进行预处理,提高训练效率;S5:基于离散柔性演员‑评论家(DSAC)算法实现功率分配策略的高效探索。本发明能够基于多智能体深度强化学习实现多干扰设备在对抗多无人机目标时的干扰功率分配,有效提升干扰资源利用率,在复杂通信对抗场景中具有良好的扩展性。
技术关键词
干扰设备
多智能体深度强化学习
功率分配方法
功率分配策略
决策
无人机编队
协作模型
波束
多无人机
神经网络结构
无线移动通信技术
强化学习理论
发射天线
资源分配
通信接收机
强化方法
系统为您推荐了相关专利信息
抽水蓄能电站
动态规划方法
负荷
动态规划算法
模糊C均值聚类算法
偏航控制方法
事件触发机制
偏航驱动系统
风电机组
转移概率矩阵
设备监测系统
设备状态监测
AI算法
回路
深度学习模型