摘要
本发明提供基于DDPG的智能体训练方法,涉及数据处理技术领域,服务器获取所训练智能体的第一电网的架构属性,基于架构属性确定所有可能出现的第一信息组;服务器基于第一电网的连接关系对第一电网分段得到多个处理子段,基于每个处理子段的子段属性对第一信息组二次分割得到第二信息组;服务器依次对第二信息组内的所有子信息进行可能性组合得到多个待训练分组,将待训练分组输入至预先配置的大模型中得到段落可能结果;服务器构建DDPG的Actor网络和Critic网络,将待训练分组、段落可能结果进行训练,得到训练后的多阶段智能体,可以将DDPG算法应用至电网调度场景,对智能体进行训练分析,提高电网调控决策的确定性,进而提升电网调控效率。
技术关键词
智能体训练方法
服务器
标签
网络
训练智能
分割设备
元素
电力设备
多阶段
分段
数据处理技术
电能
关系
决策
场景
算法
指令