摘要
本发明基于多目标奖励Q学习的双容水箱控制方法,属于机器学习与自动控制技术领域;该方法首先建立双容水箱液位控制系统的离散化数学模型,设计多目标奖励函数;其次仅在液位跟踪误差超限或控制量突变时存储经验数据,根据奖励绝对值分配采样权重;最后基于时间差分误差更新Q表,依据动态调整后的PID参数对双容水箱进行闭环实时控制;本发明设计了五维奖励函数,通过线性加权实现多指标动态平衡;仅在液位跟踪误差超限时存储经验元组,适用于双容水箱动态时变场景的快速响应需求;采用非均匀分档策略对连续状态空间进行降维,显著降低计算复杂度;构建了“感知‑决策‑执行”的一体化框架,摒弃了传统控制方法对水箱数学模型的依赖。
技术关键词
水箱控制方法
连续状态空间
误差
数学模型
参数
离散状态空间
双容水箱
控制模块
样本
工业控制器
自动控制技术
策略
生成随机数
水箱液位
离散系统
动态
稳态
液位传感器
系统为您推荐了相关专利信息
视频无损压缩方法
编码环境
去块效应滤波
码字
符号
胶囊神经网络
残差补偿方法
时钟同步方法
时间同步
分布式光伏系统