摘要
本申请公开了一种基于深度Q网络学习的SOC均衡控制方法、设备及介质,方法包括:利用仿真软件构建电池阵列仿真模型;根据当前时刻的荷电状态利用ε‑贪婪算法确定当前时刻的放电策略;以此与电池阵列仿真模型进行环境交互,并将当前时刻的荷电状态、当前时刻的放电策略、下一时刻的荷电状态和当前时刻的奖励作为当前时刻的经验,并放入经验回放池中更新积累;利用经验回放池中的经验样本以损失函数最小为目标对深度Q网络模型进行训练,并利用决策网络对待均衡电池阵列进行动态可重构电池SOC均衡控制。本申请能够在系统层面上实现电池单元的快速均衡,实现了动态可重构电池SOC的全局均衡优化,提高了动态可重构电池SOC的均衡效率。
技术关键词
深度Q网络学习
均衡控制方法
仿真模型
等效电路模型
电力电子开关
电池单元
动态可重构
仿真软件
贪婪算法
策略
阵列
均衡电池
样本
电容器
决策
梯度下降法
处理器
系统为您推荐了相关专利信息
NARX神经网络
等效电路模型
模糊控制策略
电池组
AUKF算法
电网优化调度方法
动态仿真模型
光伏发电功率
负荷
可再生能源
振荡抑制控制方法
阻抗控制器
电流控制器
变换器
滤波电容电压