摘要
本申请涉及一种置信域策略优化模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:建立汽车系统模型;构建待训练的置信域策略优化模型,所述待训练的置信域策略优化模型包括策略网络和评价网络;基于所述汽车系统模型和所述策略网络,获取标准工况训练集;基于所述标准工况训练集对所述策略网络和所述评价网络进行训练,得到训练完成的置信域策略优化模型,所述训练完成的置信域策略优化模型用于对汽车进行能量管理。提升了整车性能。
技术关键词
策略优化模型
网络
发动机
训练集
能量管理
工况
汽车
样本
计算机设备
参数
计算机程序产品
可读存储介质
处理器
训练装置
模块
存储器
加速度
邻域
系统为您推荐了相关专利信息
瓦楞纸箱
神经网络模型
数据
超声波发生器
热处理
综合管廊基坑
风险识别模型
三维模型
监控方法
平面图
实时视频
无人机
深度学习模型
特征提取网络
上采样
降噪控制方法
飞行器舱室
滤波器系数
状态机
座舱
排序模型
训练集
整体优化方法
检索文本块
提升系统