摘要
本发明公开了一种基于经验回放和策略梯度的雷达抗干扰决策生成方法、系统、介质和产品,包括:构建经验回放池;构建强化学习GPPO模型;利用经验回放池对强化学习GPPO模型训练,得到训练好的强化学习GPPO模型;利用训练好的强化学习GPPO模型对待抑制的干扰信号生成最佳抗干扰策略。本发明能够更好地利用当前和历史雷达干扰数据估计当前线性调频雷达的状态,这不仅实现了最优抗干扰决策的在线生成,还提高了其在动态电磁对抗环境中抗干扰决策生成的性能。
技术关键词
决策生成方法
雷达抗干扰
策略
二维卷积神经网络
干扰识别模型
门控循环单元
分数阶傅里叶域滤波
雷达系统
抗干扰方法
深度强化学习
线性调频雷达
基础结构
能量检测法
标志
在线
方程
计算机程序产品
参数
系统为您推荐了相关专利信息
深度强化学习模型
策略生成方法
数据
车辆行驶状况
网络部署
开关控制时序
时分复用矩阵
静电监控器
高精度模数转换器
工位
定位传感器
融合策略
机器人定位方法
GPS传感器
校正