摘要
一种基于递归博弈训练强化学习的雷达抗干扰决策方法,属于雷达抗干扰技术领域。本发明针对现有雷达抗干扰决策方法自学习能力不足以及动态适应性差的问题。包括:建立雷达方决策系统为雷达智能体,建立干扰方决策系统为干扰智能体,并组成斯坦克尔伯格博弈模型;斯坦克尔伯格博弈模型的雷达智能体与干扰智能体分别采用近端策略优化算法进行递归博弈训练强化学习,并最终达到贝叶斯纳什均衡状态,使雷达智能体具备应对动态变化干扰的抗干扰策略生成能力,实现雷达抗干扰。本发明用于雷达抗干扰决策。
技术关键词
斯坦克尔伯格博弈
决策方法
策略
神经网络参数
决策系统
雷达抗干扰技术
阶段
梯度算法
周期
动态
信号
系统为您推荐了相关专利信息
集群
任务调度策略
任务调度算法
需求预测模型
故障预测模型
面向深度学习
表格
皮尔逊相关系数
搜索算法
特征选择算法
分区管理方法
智能决策引擎
多模态特征
分区策略
实时数据