置信域策略优化模型的训练方法、装置、计算机设备、可读存储介质和程序产品

正文

推荐专利

申请号：CN202410840301

申请日期：2024-06-26

公开号：CN118569731A

公开日期：2024-08-30

类型：发明专利

摘要

本申请涉及一种置信域策略优化模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括：建立汽车系统模型；构建待训练的置信域策略优化模型，所述待训练的置信域策略优化模型包括策略网络和评价网络；基于所述汽车系统模型和所述策略网络，获取标准工况训练集；基于所述标准工况训练集对所述策略网络和所述评价网络进行训练，得到训练完成的置信域策略优化模型，所述训练完成的置信域策略优化模型用于对汽车进行能量管理。提升了整车性能。

技术关键词

策略优化模型网络发动机训练集能量管理工况汽车样本计算机设备参数计算机程序产品可读存储介质处理器训练装置模块存储器加速度邻域

系统为您推荐了相关专利信息

一种超声波辅助湿化瓦楞纸箱折线加工方法

瓦楞纸箱神经网络模型数据超声波发生器热处理

综合管廊基坑及周边建筑基坑的变形监控方法、系统

综合管廊基坑风险识别模型三维模型监控方法平面图

一种无人机巡航实时视频监测江豚的方法及系统

实时视频无人机深度学习模型特征提取网络上采样

一种飞行器座舱主动降噪控制方法及相关设备

降噪控制方法飞行器舱室滤波器系数状态机座舱

一种RAG端到端检索优化方法

排序模型训练集整体优化方法检索文本块提升系统

置信域策略优化模型的训练方法、装置、计算机设备、可读存储介质和程序产品

站点导航

APP 下载