摘要
本申请涉及一种热管理智能体训练方法、装置、车辆及存储介质,涉及计算机技术领域。该方法包括:构建降阶模型;降阶模型为基于热管理系统的参数之间的映射关系构建的神经网络模型;基于降阶模型对车辆的热管理智能体进行训练;智能体为强化学习系统中,基于观测量进行学习,以输出最优决策的系统;热管理智能体用于基于车辆的状态信息管理车辆的热管理系统。由此,基于降阶模型对热管理智能体进行训练,可以提高热管理智能体的训练效率。
技术关键词
降阶模型
神经网络结构
数据
智能体训练方法
状态信息管理
强化学习系统
工况
超立方算法
热管理系统
车辆
神经网络模型
计算机程序产品
矩阵
关系
仿真模型
计算机执行指令
压缩机转速
可读存储介质