摘要
一种基于A‑C强化学习技术的实时纵向跟车控制方法,属于智能车辆控制技术领域。本发明的目的是基于A‑C神经网络框架,可以同时估计价值函数和策略梯度,通常用于解决连续动作空间和高纬状态空间下的问题,也更适用于动态场景下车辆纵向驾驶控制的基于A‑C强化学习技术的实时纵向跟车控制方法。本发明首先强化学习A‑C框架,再设计纵向跟车控制学习系统,最后进行A‑C强化学习神经网络参数更新。本发明适应于未来车辆智能控制技术的A‑C强化学习跟车框架,一种简易的强化学习神经网络结构和一种基于反步法的参数更新方法,控制策略简单,通用性强,易于工业实践。
技术关键词
跟车控制方法
强化学习技术
参数更新方法
学习神经网络结构
神经网络参数
车辆智能控制技术
学习系统
连续动作空间
神经网络框架
矩阵
运动员
智能车辆
动态场景
控制策略
系统为您推荐了相关专利信息
热成像摄像头
WiFi探针
传感器设备
数据库表结构
注意力
风电机组高速轴
超温保护方法
历史温度数据
训练神经网络
历史运行状态
多尺度特征提取
轴承故障诊断方法
样本
特征提取器
卷积模块
无人艇智能控制
网络结构
策略
表达式
神经网络参数
离线
深度学习网络
雷达图像数据
微服务器
深度学习语义分割网络