摘要
本发明公开了基于强化学习的车辆局部避障算法及系统,该方法包括:将局部避障问题描述成稀疏奖励问题,并进行动作选择、动作执行和经验存储;基于目标重演方法将失败的经验样本标记为成功的经验样本;对经验样本进行数据采样,并基于采样数据更新学习参数;基于样本拟合误差构建样本优先级,并基于累积回报进行样本裁剪修正;基于修正样本、学习参数和损失函数的梯度定期更新目标参数。该系统包括动作选择模块、动作执行模块、经验缓存模块、经验重演模块、学习参数更新模块、样本修正模块和目标训练模块。通过使用本发明,能够在不依赖机械结构和机械参数的情况下,实现车辆的局部避障控制。本发明可广泛应用于自动驾驶技术领域。
技术关键词
样本
避障算法
重演方法
障碍物
网络
车辆
参数更新模块
数据更新
依赖机械结构
误差
自动驾驶技术
标记
避障系统
生成随机
车身
表达式
前轮
系统为您推荐了相关专利信息
典型场景生成方法
初始聚类中心
场景生成装置
序列
农村
输电线路故障
故障分类模型
故障暂态
分类方法
分类系统
网络安全设备
管理方法
网络安全防护
评估设备
预警机制