摘要
本发明公开了一种基于逆强化学习的飞艇低能耗轨迹规划方法,属于机器学习数据处理技术领域。基于逆强化学习的飞艇低能耗轨迹规划方法,包括以下步骤:飞艇及任务空间的建模,建立飞艇平面运动学状态方程,对任务空间进行网格离散化处理;收集和整理环境和专家驾驶数据;建立逆强化学习模型;使用IRL算法学习奖励函数;基于RL的轨迹规划策略学习;最优策略验证。采用本发明所述的基于逆强化学习的飞艇低能耗轨迹规划方法,通过将逆强化学习与强化学习结合,自动推导最优轨迹规划策略,使得飞艇在具有不确定因素的复杂动态环境中,能够自主适应环境变化,优化飞行轨迹合理性并提升续航能力。
技术关键词
轨迹规划方法
强化学习模型
策略
平流层飞艇
频率
计数器
风速
数据
坐标系
算法
地图
网格
地面
阻力
样本
系统为您推荐了相关专利信息
激光测振系统
压电激振器
晶体
功率放大器
激振装置
远程智能监控管理系统
数据采集模块
支持实时计费功能
远程服务器
故障诊断模块
特征提取网络
心理
解码技术
注意力机制
强化学习策略