摘要
本发明公开一种基于近端策略优化的假目标欺骗干扰抑制方法,应用于雷达探测与反对抗领域,针对现有技术中随着正交波形数量的增加,波形之间的正交性降低,存在的雷达的探测性能下降的问题;本发明构建了一个包括评估抗干扰效能和发射波形种类数的奖励,其中的环境状态由多个雷达和干扰发射波形的连续序列共同构成,然后利用强化学习中的PPO算法,通过引入一个剪切参数,收集多个轨迹和经验,实现了稳定高效的抗假目标欺骗干扰策略生成。
技术关键词
欺骗干扰抑制方法
波形设计方法
抗干扰效能
蒙特卡罗方法
雷达抗干扰
状态空间模型
算法框架
策略更新
表达式
脉冲
参数
轨迹
序列
网络
信号