摘要
本发明提供一种基于温启动DDPG的盾构机土压平衡自主控制方法,涉及盾构机技术领域。包括数据温启动和强化学习训练;基于大量施工数据对Actor网络进行温启动,学习数据中潜藏的关键特征和规律;在温启动基础上,引入深度强化学习方法,通过与实际施工环境的交互,不断优化控制策略,最终实现对盾构机土压平衡的智能决策。数据预训练使Actor网络能初步适应复杂的施工环境,降低试错次数,显著降低智能体训练初期的无效试错成本。而强化学习训练则通过与动态施工环境的实时交互,形成状态感知‑决策优化‑执行反馈的闭环控制链条,不仅实现控制策略在掘进过程中渐进式精细化调整,还提升了决策响应速度与精度,最终实现对盾构机土压平衡的智能决策。
技术关键词
自主控制方法
密封舱
网络
螺旋输送机
掘进参数
深度强化学习方法
压力
鲸鱼优化算法
优化控制策略
超参数
决策
数据
阶段
全局优化方法
随机噪声
盾构机技术
叶片螺距