摘要
一种基于AME‑TD3算法的热电联产系统控制策略,属于热电联产系统优化控制技术领域。包括以下步骤:S1:采集系统参数与CHP运行状态的初始化;S2:计算目标值时,引入熵奖励机制;S3:实现基于Critic网络评估的自适应噪声调节机制,动态平衡策略的探索与利用;S4:控制策略实时优化。本发明针对现有TD3算法探索性不足的问题,在目标值计算中引入熵修正项,对目标值函数进行结构性修正,使策略更新更加高效,提升整体策略优化的有效性;针对传统TD3算法中的随机噪声无法适应复杂环境的问题,在策略更新过程中加入了动态自调整的噪声生成功能,以提高收敛速度并增强稳定性,增强系统对负荷波动与环境条件变化的自适应调节能力。本发明具备良好的可扩展性。
技术关键词
热电联产系统
控制策略
CHP系统
网络
算法
采集系统
参数
机制
策略更新
随机噪声
系统控制
有效性
批量
数据
因子
负荷
动态