摘要
本发明公开了一种基于进度平衡的智能体多任务并行训练方法及系统,涉及智能体训练技术领域。本发明通过将智能体划分为表演者智能体和学习者智能体,进而能够基于表演者智能体和学习者智能体在训练过程中结合轨迹的采样权值对训练过程进行调整,实现了平衡进度的智能体多任务训练,有效的提高了多任务环境下智能体的表现与训练速度,提高了电力系统的控制效率。通过构建多任务并行训练框架,实现了进度平衡,确保了每个系统任务对应的智能体在训练过程都能有合理的关注,提高了电力系统的稳定性和效率。通过动态调整智能体的采样权值,并结合柔性动作评价算法实现了多任务环境中智能体的平衡,确保了电力系统的控制效率。
技术关键词
并行训练方法
多任务
轨迹
评价算法
电力系统调控
框架
柔性
样本
模块
数据
参数
训练系统
网络
仿真模型
因子
周期
电压
策略
功率