摘要
本发明属于航空航天技术领域,公开了一种基于分层强化学习的攻击时间约束制导方法及相关装置;其中,所述基于分层强化学习的攻击时间约束制导方法包括:获取飞行器的导引头对于机动目标的量测信息,并利用训练好的双层智能体模型进行飞行制导,输出制导加速度指令;双层智能体模型中,上层深度强化学习智能体用于根据导引头量测信息自适应调整期望视线角曲线和视线角速率曲线生成参考轨迹;下层深度强化学习智能体用于接收参考轨迹和导引头量测信息,生成制导加速度指令。本发明公开的技术方案,有效解决了现有方法在应对高速机动目标时剩余飞行时间难以精确估计的技术难题。
技术关键词
深度强化学习
分层强化学习
双层智能
制导方法
网络
数学模型
飞行器
加速度
曲线
策略
速率
最小化误差
非暂态计算机可读存储介质
参数
决策
航空航天技术
轨迹
指令
样本
制导系统
系统为您推荐了相关专利信息
非线性动态系统
RBF神经网络
计算机可读指令
工业
残差矩阵
情感识别方法
语义特征
状态空间模型
样本
数据生成图像
跟踪方法
特征融合网络
可见光
通道注意力机制
卡尔曼滤波
自动化测试用例
副本
生成方法
动态课程
训练智能体