摘要
本发明公开了一种基于多智体近端策略优化算法的雷达航迹规划方法,该方法获取多基地雷达的初始雷达状态参数后利用多基地雷达对目标进行量测,得到目标量测信息;再根据目标量测信息,利用预先得到的多基地雷达的动作决策模型,得到多基地雷达的偏向角;其中,基于马尔可夫决策过程利用多智能体强化学习算法得到动作决策模型;最后根据多基地雷达的偏向角,得到下一时刻的多基地雷达的雷达状态参数;在预设飞行时间内,重复上述步骤得到多基地雷达的航迹规划。本发明将雷达系统与环境的交互过程建模为MDP,基于定位精度的奖励函数驱动多基地雷达系统对目标进行最佳构型定位,最终迭代形成针对目标定位精度的多基地雷达的最优航迹。
技术关键词
雷达航迹
基地
多智能体强化学习
费歇尔信息矩阵
算法
策略
决策
航迹规划
协方差矩阵
发射站
测量误差
坐标
雷达系统
构型
元素
速度
运动