摘要
本发明属于自动驾驶汽车技术领域,具体的说是一种基于强化学习的车辆轨迹跟踪控制器参数整定方法。包括以下步骤:步骤一、通过汽车和目标轨迹之间的运动学关系,结合泰勒级数展开线性化方法建立了汽车轨迹跟踪模型;步骤二、采用模型预测控制理论建立了考虑系统跟随精度、转向平顺性、执行器特性约束的汽车轨迹跟踪控制器;步骤三、将汽车轨迹跟踪控制器中的待标定参数建模为强化学习的智能体动作输出,应用双延迟深度确定性策略梯度技术进行最优虚拟标定。本发明实现了轨迹跟踪控制器的关键参数整定,有效地提升了轨迹跟踪控制器的跟踪精度,为车辆轨迹跟踪的参数标定工作提供一种有效的解决方案。
技术关键词
车辆轨迹跟踪
轨迹跟踪控制器
连续时间系统
深度确定性策略梯度
后轴
矩阵
模型预测控制理论
误差向量
网络
车辆系统
坐标
参数
状态空间方程
车辆运动学
误差模型
线性化方法
系统为您推荐了相关专利信息
调控模型
门控循环单元
深度确定性策略梯度
调控方法
调控策略
销售数据管理
电子元件
动态知识图谱
时效性
强化学习算法
优化控制模型
智慧物流车
深度确定性策略梯度
生成方法
仿真环境
扭矩控制方法
牵引力系统
增程器发电功率
横摆角速度
车辆
执行器
深度确定性策略梯度
任务调度方法
环境状态信息
资源