基于递归博弈训练强化学习的雷达抗干扰决策方法

AITNT
正文
推荐专利
基于递归博弈训练强化学习的雷达抗干扰决策方法
申请号:CN202510348560
申请日期:2025-03-24
公开号:CN120195629A
公开日期:2025-06-24
类型:发明专利
摘要
一种基于递归博弈训练强化学习的雷达抗干扰决策方法,属于雷达抗干扰技术领域。本发明针对现有雷达抗干扰决策方法自学习能力不足以及动态适应性差的问题。包括:建立雷达方决策系统为雷达智能体,建立干扰方决策系统为干扰智能体,并组成斯坦克尔伯格博弈模型;斯坦克尔伯格博弈模型的雷达智能体与干扰智能体分别采用近端策略优化算法进行递归博弈训练强化学习,并最终达到贝叶斯纳什均衡状态,使雷达智能体具备应对动态变化干扰的抗干扰策略生成能力,实现雷达抗干扰。本发明用于雷达抗干扰决策。
技术关键词
斯坦克尔伯格博弈 决策方法 策略 神经网络参数 决策系统 雷达抗干扰技术 阶段 梯度算法 周期 动态 信号
系统为您推荐了相关专利信息
1
一种面向大模型训练的GPU集群算力优化架构
集群 任务调度策略 任务调度算法 需求预测模型 故障预测模型
2
一种面向深度学习表格识别模型演化的回归缺陷缓解方法
面向深度学习 表格 皮尔逊相关系数 搜索算法 特征选择算法
3
基于深度学习的弱网环境视频压缩方法
视频压缩方法 深度学习模型 参数 客户端 网络
4
一种基于养成型儿童玩具的学习方法及系统
文本 TTS技术 儿童玩具 学习方法 语音
5
一种MySQL表分区管理方法、设备及介质
分区管理方法 智能决策引擎 多模态特征 分区策略 实时数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号