摘要
本申请属于无人机技术领域,公开了一种基于离线强化学习的无人机路径规划方法,通过建立无人机与车辆的通信时延模型和无人机能耗模型,利用SUMO交通仿真器对交通流进行仿真,记录无人机和车辆状态数据,生成离线训练数据集用于离线强化学习训练,依据所述离线训练数据集设计用于深度强化学习的无人机状态空间、动作空间和奖励函数,训练离线强化学习模型,结合无人机的初始位置,基于训练好的离线强化学习模型输出无人机飞行路径。该方法可以在降低无人机能耗的同时,有效减少通信时延,从而显著提升无人机在复杂动态环境中的任务完成率。
技术关键词
强化学习模型
离线
无人机飞行路径
时延
车辆状态数据
记录无人机
仿真器
深度强化学习
梯度下降算法
能耗
交通流
消息
车辆纵向运动
平均等待时间
神经网络参数
无人机技术