摘要
本发明公开了一种模拟环境中雷达模式与机动决策协同策略生成方法,包括:分析雷达工作模式的功能特性,根据分析结果设计相应工作准则约束;基于角度、距离、高度的考虑构建攻击奖励函数,基于工作准则约束构建雷达奖励函数,根据攻击奖励函数和雷达奖励函数构建总奖励函数;定义由载机状态信息、目标状态信息、相对态势信息、传感器状态信息构成的状态空间,定义由机动动作空间和雷达动作空间构成的混合动作空间;设计基于EDN‑PPOA的深度强化学习算法框架,基于模拟环境调整网络参数,以输出最优网络参数对应的混合动作策略模型;将状态空间输入混合动作策略模型,输出相应的混合动作空间。本发明实现了机动决策和雷达策略上的协同。
技术关键词
协同策略生成方法
雷达工作模式
网络
深度强化学习算法
动作策略
方位角
决策
噪声参数
定义
传感器
框架
速度
鲁棒性
因子
系统为您推荐了相关专利信息
深度强化学习
节点
网络状态信息
迭代消息传递算法
神经网络参数
堤坝白蚁
白蚁巢穴
多模态数据采集
防治方法
三维形态模型
数字孪生模型
物理
LSTM神经网络
岩土参数
设备状态数据