摘要
本发明公开一种雷达干扰决策方法和装置、系统、存储介质,包括:步骤S1、根据雷达‑干扰机对抗环境,得到雷达工作模式转换与干扰机释放干扰信号间的潜在联系;步骤S2、将当前雷达工作模式对应的威胁等级作为环境状态参数输入到基于自适应贪婪调节和优先双重经验回放的竞争双重深度Q网络决策结构中进行价值评估、经验录入、经验抽取和参数更新操作,得到雷达干扰决策结果。采用本发明的技术方案,解决传统强化学习算法存在策略收敛效果较差和经验存储方式不足的问题。
技术关键词
雷达干扰决策方法
雷达工作模式
干扰决策装置
间歇采样转发干扰
噪声调幅干扰
深度Q网络
时间段
强化学习算法
决策系统
调频
处理器
切片
存储器
参数
措施
场景
系统为您推荐了相关专利信息
模糊推理系统
策略生成方法
表达式
评价器
模糊规则
多功能一体化系统
波形设计方法
通信接收机
间歇采样转发干扰
相控阵雷达
雷达
干扰波
生成方法
检测门限值
间歇采样转发干扰
深度学习网络
雷达
欺骗干扰信号
识别方法
噪声干扰信号