摘要
本发明涉及一种基于深度强化学习的变比例导引轨迹跟踪方法。该方法通过构建深度强化学习框架,将拦截问题建模为马尔可夫决策过程,以偏置作为训练动作,减少动作空间维度,提高训练效率。同时,充分考虑拦截器一阶自动驾驶仪的动态特性,确保策略的现实可行性。奖励函数设计中,综合平衡能量消耗与轨迹跟踪精度,并引入视场角约束。最终,该方法能够在视场角和过载饱和约束下,实现目标的高精度拦截和低能量消耗,为轨迹跟踪策略优化提供理论与技术支持。
技术关键词
拦截器
轨迹跟踪方法
自动驾驶仪
视场角
高精度轨迹跟踪
平衡能量消耗
深度强化学习模型
动态状态信息
轨迹跟踪系统
加速度
方程
惩罚策略
指令
框架
处理器
引导系统
系统为您推荐了相关专利信息
无人机编队避障
编队控制器
运动控制模型
自动驾驶仪
障碍物
气体泄漏检测
初始轮廓
红外探测器
轮廓图像
设备获取数据
反射板
激光雷达点云数据
三维模型
视场角
仿真模型