摘要
本发明属于雷达干扰决策技术领域,具体涉及一种优化经验存储的雷达干扰决策方法、程序、设备及存储介质。本发明综合考虑实际应用场景中执行干扰决策的多项需求,设计雷达干扰决策模型的状态、动作以及奖励函数。本发明设计了一种新的吸引‑排斥优化算法,引入信息交互因子,赋予成员信息获取和交流特性,改变种群的更新机制,提高算法的全局性。本发明在生成经验样本时通过改进的吸引‑排斥优化算法对其进行优化,生成优质经验样本并存入优化经验回放池,加速模型收敛,解决了模型收敛效果不佳的问题;采用训练好的DDPG网络应用于干扰设备的实际干扰决策,提高了实际应用场景中模型干扰决策的有效性。
技术关键词
雷达干扰决策方法
干扰设备
发射天线
因子
信号
脉冲重复间隔
算法
网络
计算机装置
计算机程序产品
处理器
样本
模型更新
机制
回波
指令
计算方法
可读存储介质