摘要
本发明公开了一种基于博弈强化学习的电动汽车参与配电网无功调度方法,包括:采集节点电压、线路电流、电动汽车充放电状态及拓扑信息,构建图注意力嵌入;在多智能体博弈强化学习框架中生成初始无功调节动作并经双重奖励塑形更新策略梯度;以更新策略梯度初始化改进粒子群并设自适应惯性系数;依据节点电压灵敏度、线路无功裕度和期望收敛步数迭代搜索得到优化粒子群;在线协同训练将粒子速度映射至主策略网络并同步调整惯性系数,输出协同优化策略,生成无功调度指令并据实时反馈闭环更新算法。本发明实现电动汽车群体快速协同的无功动态调度,显著提升电压稳定性和电能质量。
技术关键词
强化学习框架
策略
车辆间协作
粒子群优化算法
矩阵
电压
速度
一致性检测
网络拓扑信息
节点阻抗灵敏度
因子
线路
参数
梯度下降算法
注意力机制
索引
系统为您推荐了相关专利信息
分布式数据中心
隐私约束条件
负载优化方法
管理策略
排队模型
智能换热机组
时序预测模型
位置偏差值
计算机程序指令
机组控制技术