摘要
本申请公开了一种蓄电池能量分配方法、装置、设备及存储介质,涉及蓄电池技术领域,包括:采集蓄电池的状态数据;将所述状态数据输入智能体策略网络,得到最优动作,并确定下一时刻状态数据;将所述状态数据以及最优动作输入智能体评估网络,得到奖励值;基于所述最优动作、状态数据、奖励值以及下一时刻状态数据,生成交互经验,并将所述交互经验存放至经验回收池中;从所述经验回收池中抽取目标交互经验,并基于所述目标交互经验调整深度强化学习模型的参数,以通过优化的深度强化学习模型确定蓄电池在当前状态数据下的当前最优动作后实现蓄电池能量分配。本申请能够实现最优的蓄电池能量分配。
技术关键词
深度强化学习模型
能量分配方法
数据
充放电功率
电池充电状态
能量分配设备
能量分配装置
策略
寿命
网络
输入模块
蓄电池技术
参数
因子
处理器
待机