摘要
一种基于强化学习的雷达对抗自主决策方法,它属于雷达对抗自主决策领域。本发明解决了现有干扰方法存在的干扰效果差以及干扰效率低的问题。本发明采用基于融合改进的麻雀搜索算法与支持向量机的雷达辐射源工作状态自动识别技术,可以避免现有方法收集和分析非合作方雷达信号所需时间长的问题,提高了干扰的效率;并结合Q‑learning算法和多臂匪徒策略来生成干扰决策和干扰参数,显著提高了干扰样式和干扰参数选择的效率以及适应性,并保证了干扰的效果。本发明方法可以应用于雷达对抗自主决策。
技术关键词
自主决策方法
雷达辐射源信号
强化学习网络
位置更新
支持向量机
样式
正则化参数
高斯径向基函数
脉冲到达时间
搜索算法
自动识别技术
指纹
生成随机数
干扰方法
训练集数据
规模