摘要
本发明属于无人履带车辆轨迹跟踪控制技术领域,具体涉及一种基于深度强化学习的履带车辆轨迹跟踪精度优化方法,包括:步骤一:根据履带车辆建立基于瞬时转向中心的运动学模型;步骤二:根据经验设置预测时域控制时域,对未来轨迹进行预测;步骤三:设计深度强化学习状态量和动作量;步骤四:设计深度强化学习Critic网络和Actor网络的结构;步骤五:对智能体进行训练;进行多轮迭代优化,直至达到理想的训练效果;步骤六:导出训练好的智能体进行在线运算,实时解算出需要的补偿输出值,与步骤二输出的控制量相加,作为底层执行系统的输入;至此,完成控制量的补偿,实现对轨迹跟踪控制的实时优化。该方法提升了履带车辆轨迹跟踪的精度。
技术关键词
精度优化方法
履带车辆
状态量信息
状态空间方程
网络
深度强化学习算法
雅可比矩阵
非线性系统
非线性控制系统
轨迹跟踪控制器
车辆横摆角速度
跟踪控制技术
车辆状态参数
车体坐标系
在线
系统为您推荐了相关专利信息
门控循环单元
重构方法
重构模型
载荷
综合评价指标
门控循环网络
数字预失真方法
注意力机制
信号预处理模块
功率放大器
智能管理方法
能耗监测数据
多模型
排放量
识别模组
行人重识别模型
图像张量数据
重识别方法
空间特征提取
点云特征提取