摘要
一种基于深度强化学习的线路路径规划方案生成方法及系统,方法首先构建规划区域的栅格地图与评价指标体系,并基于Critic法确定指标权重来构建栅格综合成本评价模型,接着以总成本最小为目标构建路径规划模型,并将其描述为马尔科夫决策过程,再将混合噪声及ε‑贪婪策略引入深度确定性策略梯度算法,并改进优先经验回放机制,得到改进的深度确定性策略梯度算法,最后基于该算法训练智能体,输出最优的输电线路规划路径;本发明通过添加混合噪声,增加智能体探索能力,并引入贪婪策略加快算法初段的学习效率和减少探索频率,以减少不必要的试错,最后在优先经验回放机制中融入即时奖励值,帮助智能体精确区分不同经验的重要性,加快智能体学习效率。
技术关键词
深度确定性策略梯度
表达式
输电线路规划
深度强化学习
贪婪策略
噪声
生成方法
指标
训练智能体
矩阵
时序
生成系统
栅格地图
决策
梯度算法
样本
系统为您推荐了相关专利信息
Kriging模型
可靠性分析方法
表达式
累积分布函数
联合仿真系统
速度控制方法
同步电机
速度控制器
速度控制设备
表达式
虚拟同步机
新型电力系统
状态空间方程
坐标系
电力系统建模
节点
度计算方法
数据
训练深度学习模型
顶点特征