摘要
本发明涉及一种低温快充场景下热管理系统控制策略优化方法,包括以下步骤:搭建训练环境:确定电动汽车的热管理系统在低温快充场景下工作模式,搭建整车仿真模型;构建动作空间,构建状态空间,确定动作空间的取值范围和状态空间的考察范围;制定训练工况,以匀分布采样确定出每个训练回合起始时刻的环境温度和乘员舱设定温度;构建奖励函数,搭建Actor网络和Critic网络,强化学习训练。本发明还提出了一种存储介质。本发明通过强化学习算法对智能体进行训练,寻找低温快充场景下充电时间、乘员舱热舒适性和热管理系统能效的平衡。能够解决低温快充场景下的充电时间、乘员舱热舒适性和热管理系统能耗多目标优化控制问题。
技术关键词
控制策略优化方法
动力电池荷电状态
乘员
强化学习算法
场景
计算机可读程序
仿真模型
热管理系统
变量
网络
三通阀
工况
车载传感器
整车
误差区间
挡位