摘要
本发明公开一种基于改进TD3算法的无人机自主导航方法,包括:设计改进TD3算法的状态空间、动作空间、奖励函数、策略网络、价值网络、成功经验池及失败经验池;初始化状态和临时经验池,策略网络收集数据添加到临时经验池,临时经验池数据溢出则将溢出数据添加到成功经验池;判断是否达到更新条件,达到更新条件,从成功经验池和失败经验池中按照比例随机采样数据,用采样数据更新价值网络和策略网络;未达到更新条件,判断无人机是否达到终止状态,达到成功的终止状态时,将临时经验池的数据全部放到成功经验池,若是失败的终止状态,将临时经验池的数据全部放到失败经验池。本发明提高了采样数据的质量,从而提升无人机自主导航的效率。
技术关键词
无人机自主导航
网络
障碍物
策略
算法
激光距离传感器
数据更新
射线
因子
正则化参数
决策
定义
直线
视角
连线
系统为您推荐了相关专利信息
损伤识别模型
前馈神经网络
多模态深度学习
损伤识别系统
图像
充放电循环次数
显示电池容量
深度学习网络
建立平面直角坐标系
参数
早期预警方法
机器学习算法模型
长短期记忆网络
数据
机器学习分类器
混凝土地坪
观测装置
红外热成像仪
分布式光纤传感器
激光整平仪
稀疏特征
特征融合网络
注意力机制
空间金字塔
特征提取网络