基于示范辅助的强化学习悬架控制方法、系统及存储介质

正文

推荐专利

申请号：CN202511014864

申请日期：2025-07-23

公开号：CN120517116B

公开日期：2025-09-19

类型：发明专利

摘要

本申请涉及车辆控制的技术领域，公开一种基于示范辅助的强化学习悬架控制方法、系统及存储介质，方法包括：根据示范样例使用克隆模仿学习算法进行控制策略初始化；根据预设的深度确定性策略梯度算法生成状态转移四元组集合；使用最小化贝尔曼误差算法学习评价者网络；根据策略参数最大化行动‑值函数的估计值学习行动者网络；状态转移四元组存入第一回放缓存中；从第一回放缓存中抽样多个状态转移四元组，更新评价者网络和行动者网络；根据当前状态的价值函数估计值与目标之间的均方误差得到价值函数损失；根据当前控制策略和示范样例产生者之间差值的最小值作为策略损失；根据总损失执行随机梯度下降优化控制策略的参数，提升训练样本效率。

技术关键词

悬架控制方法执行随机梯度下降网络参数优化控制策略示范系统学习算法悬架控制系统控制智能体滑动滤波样本误差补偿算法汽车悬架数据滤波算法

系统为您推荐了相关专利信息

基于多序列特征提取与多维特征融合的磁异常识别方法

异常识别方法磁异常数据融合深度学习模型运动环境噪声干扰

一种车联网计算卸载与内容缓存的耦合方法及其系统

耦合方法深度确定性策略梯度精英遗传算法双时间尺度决策

一种睡眠质量监测评估的方法和系统

检测评估方法时空特征学习注意力检测评估系统模态特征

高速连接器的性能仿真优化方法及系统

高速连接器仿真优化方法网格模型三维结构时域电磁场

一种AR眼镜辅助光动力诊疗设备

组织图像处理模块光发射模块 AR眼镜诊疗设备

基于示范辅助的强化学习悬架控制方法、系统及存储介质

站点导航

APP 下载