摘要
本发明公开了基于增强学习训练的无人机自适应优化方法,包括:S1、构建无人机状态空间,将状态空间下的飞行决策动作进行离散化,构建动作空间;S2、通过近端策略优化算法搭建动作学习模型;S3、获取状态空间中无人机执行任务的动态数据;S4、通过获取的状态信息,从动作空间中选择一个飞行决策动作,执行所选动作后,获取新的状态以及对应的奖励值;S5、将当前状态、执行的动作和获得的奖励值以及新状态存储到经验回放缓冲区中;S6、从缓冲区中随机采样一批数据,训练飞行学习模型,做出飞行决策,直至飞行任务完成。本发明能够实时感知环境变化,自主学习做出最优飞行决策,提高无人机任务执行能力。
技术关键词
动态障碍物
载波相位差分技术
构建无人机
决策
策略
三维点云识别
数据
感知环境变化
生成三维点云
融合无人机
神经网络架构
长短期记忆网络
识别障碍物
随机梯度下降
微机电系统
算法
参数
多层感知机
系统为您推荐了相关专利信息
关键词
接口
单元测试用例
行业术语
DOM树结构
中央控制模块
模糊神经网络
人机交互界面
决策
数据采集模块
深度强化学习
虚拟网络
决策方法
资源约束条件
节点
机器学习模型
计算机程序产品
周期
视频转码效率
决策树模型
预测运动轨迹
机器人避障方法
人机协作
动态避障
运动特征