摘要
本发明提供一种干扰策略生成方法、装置及设备,所述方法包括:在干扰机与雷达的对抗场景下,对干扰机与雷达的对抗过程进行采样,得到雷达的状态转移矩阵的估计值;将状态转移矩阵中每行数据的和归一化为1,得到原始马尔可夫环境;基于状态转移矩阵的估计值及原始马尔可夫环境计算得到多个合成马尔可夫环境;在多个合成马尔可夫环境中并行运行Q‑Learning算法,以分别学习得到一Q值表;基于JS散度的自适应加权机制融合处理多个Q值表,得到第一综合Q值表;重复上述步骤以完成预设数量次的迭代计算;响应于迭代计算的完成,得到目标综合Q值表,基于目标综合Q值表确定最优干扰策略。本发明提供的方案能够快速准确地生成用于干扰雷达的最优干扰策略。
技术关键词
策略生成方法
雷达
矩阵
策略生成装置
Q学习算法
场景
贪婪策略
机制
电子设备
采样模块
效能
模式
存储器
控制模块
处理器
数据
方程
系统为您推荐了相关专利信息
桥梁裂缝检测方法
像素点
识别神经网络
矩阵
蓝色
不确定性评估方法
模型参数不确定性
气象
海洋
全局灵敏度分析
网格
二维DOA估计
方位角
信号源
线性虚拟阵元
微波
雷达控制系统
数据处理算法
模式
雷达控制装置
链路状态监测
多跳通信
通信方法
粒子群优化算法
动态