摘要
本发明公开了一种改进的智能车路径规划方法,算法首先采集数据训练策略网络模型参数,完成训练过程后,输入激光雷达数据、智能车位置和目标位置等状态信息到网络模型推理,输出智能车动作,重复该过程直到到达目标点;本发明针对强化学习算法训练时间长、训练速度慢以及样本使用效率低的问题,设计了一种针对路径规划任务的混合奖励函数,提供了更好的环境反馈。同时,加入改进的优先经验回放技术,赋予数据不同的权重,从经验池中选择高质量样本,并用概率分布采样的方法替代传统Sum‑Tree结构的采样过程,实现更高效的采样速度,能够有效加快强化学习算法训练过程,缩短训练时间,提高样本利用效率。
技术关键词
策略网络模型
激光雷达数据
智能车
样本
SAC算法
强化学习模型
强化学习算法
机器人
状态更新
规划
回放技术
算法框架
参数
坐标
运动
系统为您推荐了相关专利信息
生物标志物
预测膀胱癌
膀胱癌风险
预测系统
诊断膀胱癌
快速识别方法
支持向量机模型
混合液
识别策略
样本
监测方法
孤立森林算法
订单
样本
计算机程序指令