摘要
本发明公开了一种基于强化学习与粒子群优化的污水处理药品投放控制方法,通过动态调整粒子群参数与强化学习策略融合,实现浊度精准控制与药品成本优化。其技术方案包括:将PSO算法与DDPG算法结合,构建药品控制模型;设计奖励函数;采用全保留经验池存储状态覆盖率高于第一预设阈值的经验数据,策略经验池按先进先出方式保留当前策略访问大于第二预设阈值的经验数据,并按预设比例混合采样;训练药品控制模型;将当前浊度值、上一时间步的药品投放量、进水流量、水质检测相机参数和未来浊度值输入训练好的药品控制模型,输出当前的药品投放量。本发明通过预测‑控制闭环集成,将原水浊度预测结果反馈至优化器,适用于污水处理系统的实时自适应控制。
技术关键词
投放控制方法
浊度
先进先出方式
粒子
检测相机
投放控制装置
强化学习策略
时序预测模型
污水处理系统
覆盖率
网络
参数
因子
算法模型
水质
原水
数据
控制权