摘要
本发明公开了一种基于多智能体强化学习的多域联合干扰资源分配方法及系统,其中方法步骤包括:基于多干扰机协同干扰任务,构建多对多对抗环境模型;基于多对多对抗环境模型,定义多干扰机联合状态空间;基于多对多对抗环境模型,设计多干扰机联合动作空间;基于多干扰机联合状态空间和多干扰机联合动作空间,构造多域信息联合表征的全局奖励函数;基于全局奖励函数,进行最优策略学习;多智能体系统根据学习到的最优策略做出决策。本发明通过采用值分解网络算法,并设计多干扰机联合状态空间、多干扰机联合动作空间和全局奖励函数,实现了对我方多干扰机的干扰波束分配和干扰功率大小的动态调整,从而能够提高对敌方雷达系统的干扰效率和灵活性。
技术关键词
干扰资源分配方法
多智能体强化学习
多智能体系统
策略
连续动作空间
资源分配系统
独立智能
定义
矩阵
雷达系统
决策
表达式
传播算法
模块
多波束
网络结构
系统为您推荐了相关专利信息
新能源电网
调控装置
接口模块
双闭环控制策略
新能源发电设备
智能博弈对抗
异构
强化学习算法
博弈方法
动作策略
双层协调优化方法
能源管理系统
环境监测系统
波动特征
历史运行数据