基于递归博弈训练强化学习的雷达抗干扰决策方法

正文

推荐专利

申请号：CN202510348560

申请日期：2025-03-24

公开号：CN120195629A

公开日期：2025-06-24

类型：发明专利

摘要

一种基于递归博弈训练强化学习的雷达抗干扰决策方法，属于雷达抗干扰技术领域。本发明针对现有雷达抗干扰决策方法自学习能力不足以及动态适应性差的问题。包括：建立雷达方决策系统为雷达智能体，建立干扰方决策系统为干扰智能体，并组成斯坦克尔伯格博弈模型；斯坦克尔伯格博弈模型的雷达智能体与干扰智能体分别采用近端策略优化算法进行递归博弈训练强化学习，并最终达到贝叶斯纳什均衡状态，使雷达智能体具备应对动态变化干扰的抗干扰策略生成能力，实现雷达抗干扰。本发明用于雷达抗干扰决策。

技术关键词

斯坦克尔伯格博弈决策方法策略神经网络参数决策系统雷达抗干扰技术阶段梯度算法周期动态信号

系统为您推荐了相关专利信息

一种面向大模型训练的GPU集群算力优化架构

集群任务调度策略任务调度算法需求预测模型故障预测模型

一种面向深度学习表格识别模型演化的回归缺陷缓解方法

面向深度学习表格皮尔逊相关系数搜索算法特征选择算法

基于深度学习的弱网环境视频压缩方法

视频压缩方法深度学习模型参数客户端网络

一种基于养成型儿童玩具的学习方法及系统

文本 TTS技术儿童玩具学习方法语音

一种MySQL表分区管理方法、设备及介质

分区管理方法智能决策引擎多模态特征分区策略实时数据

基于递归博弈训练强化学习的雷达抗干扰决策方法

站点导航

APP 下载