摘要
本申请实施例提供了一种车辆控制决策模型的训练方法、数据获得方法及装置,方法包括:利用车辆控制决策模型根据连续M个时刻的车辆状态数据,预测未来连续J个时刻中每个时刻的预测车辆控制数据以及每个时刻的预测奖励;根据每个时刻的车辆状态数据确定各时刻的驾驶安全性奖励、驾驶平顺性奖励以及驾驶节能性奖励;利用近端策略优化损失函数基于J个时刻中每个时刻对应的驾驶安全性奖励、驾驶平顺性奖励、驾驶节能性奖励、预测奖励、样本运行控制参数以及预测车辆控制数据确定累积奖励,以调整车辆控制决策模型的模型参数得到训练后的车辆控制决策模型,通过该方法,能够在保证驾驶安全和平顺的同时,实现最优的能量控制。
技术关键词
车辆状态数据
样本
决策模型训练方法
能量消耗
特征提取网络
加速度
策略
序列
模型训练装置
可读存储介质
能量控制
数据获取模块
参数
物体
能源
系统为您推荐了相关专利信息
分类方法
表达式
神经网络训练
模糊神经网络模型
样本
助听器外壳
三维模型
匹配度判断方法
腔体
强化学习模型
深度学习模型
轴承故障诊断
分类方法
频域特征
全局特征提取