基于强化学习的多约束飞行器航迹快速规划方法

正文

推荐专利

申请号：CN202410723982

申请日期：2024-06-05

公开号：CN118482727A

公开日期：2024-08-13

类型：发明专利

摘要

本发明公开了一种基于强化学习的多约束飞行器航迹快速规划方法，通过建立飞行器航迹模型、状态空间和动作空间；设计飞行器航迹规划问题强化学习方法的奖励函数，将飞行器每次选择的动作后所带来的状态、动作、奖励作为经验保存在Q表中，用Q表记录状态‑动作对的选择概率；强化学习通过迭代训练来学习Q表，在每一个迭代过程中会探索不同的动作，并更新Q表并利用Q表中存储的经验来指导动作选择；飞行器在当前状态选择动作时是按照概率选择，根据ε‑贪婪算法以ε概率随机选择一个动作，以1‑ε的概率选择Q表中此状态最大值对应的动作；当飞行器选择动作后，根据结果来进行奖励或惩罚。

技术关键词

水平误差飞行器航迹规划强化学习方法优化飞行器贪婪算法误差校正坐标终点圆心水平校正校正误差表达式线段直线方程

系统为您推荐了相关专利信息

一种电动汽车无线充电系统漏磁优化方法

无线充电系统磁感应强度改进型粒子群算法数学模型发射线圈尺寸

一种家居设备的远程物联控制系统及控制方法

物联控制系统家居设备家居系统设备控制指令历史故障数据

基于大模型知识增强的交互式临床决策支持系统与方法

临床决策支持系统医疗知识图谱强化学习模型电子病历系统节点

稀土金属电解炉出料机器人及其末端柔顺控制方法及系统

稀土金属电解炉柔顺控制方法虚拟仿真环境强化学习网络机器人控制器

基于OpenAI Gym和策略空间泛化的强化学习方法

强化学习方法策略强化学习算法蒙特卡洛方法恢复方法

基于强化学习的多约束飞行器航迹快速规划方法

站点导航

APP 下载