摘要
本发明涉及基于强化学习的模型车速度分层反馈与双时滞自适应控制技术领域,且公开了一种基于强化学习的模型车速度控制系统及方法。在车前下方布置摩擦感知,按采样获取切向力与法向力,建立法向力基准与异常保护,计算摩擦并编码路面;干燥取最大安全速度,湿滑按裁剪摩擦与阈值比例设定目标。测速有效化并剔除无效动作,以显著速度差和方向一致性确认响应步,分层统计平均时滞;将当前测速、滞后速度、目标速度归一化,结合时滞步数与路面编码组成状态。构造离散速度增量并限幅输出下一周期指令;以目标偏差与相邻动作差构成奖励;量化状态,建立分层价值表并以递减学习率和固定折扣更新;每周期选最优且优先小幅或零增量。
技术关键词
速度控制方法
模型车
周期
路面
速度控制系统
编码
增量更新
指令
分层
车载控制单元
索引
物理
基准
执行增量
偏差
因子
干燥层
分箱
驱动器