摘要
本发明提供一种端到端自动驾驶模型训练方法及装置,端到端自动驾驶模型训练方法及装置包括采集车辆的运行参数,基于“演员‑评论家”框架建立自动驾驶模型,采用融合自适应参数空间噪声的DDPG算法,对DDPG算法中的评论家网络和演员网络的参数进行初始化;选择Adam优化器并初始化经验回放池,存储智能体与环境交互的经验,设置初始学习率以及确定批量大小;使用经验回放池中的经验更新评论家网络和演员网络的参数;调整自动驾驶车辆的性能,本发明提供的端到端自动驾驶模型训练方法及装置,该方法通过调整至适当的学习率以及批量大小,加速模型的收敛速度,对超参数中学习率以及批量大小进行调整,使模型在训练过程中更加稳定。
技术关键词
驾驶模型训练方法
梯度下降法
批量
车辆
策略更新
变量
参数噪声
网络结构
梯度方法
算法
网络优化
周期性
优化器
存储单元
框架
系统为您推荐了相关专利信息
电子外后视镜
变道预警方法
变道预警装置
转向灯
动态
参数标定方法
PID控制器
模型预测控制算法
前轮
横摆角速度
管控方法
可信执行环境
分布式私钥
TPM芯片
指纹
电池热失控
处置装置
热失控风险
电机法兰
自动驾驶系统
电池单体
电池状态参数
车辆状态参数
故障识别方法
电池组荷电状态