摘要
本申请公开了一种船舶新型冷却系统强化学习控制方法,包括:确定船舶新型冷却系统的输入实测值和输出动作值,所述输入实测值为与真空度/过冷度控制目标强相关的状态参数,所述输出动作值包括喷淋阀门开度和凝水循环泵转速;构建强化学习奖励函数,通过奖励函数反映海水换热器衍变过程对真空度/过冷度的影响程度;进行网络参数离线训练,包括策略网络离线训练和价值网络离线训练;将离线训练完成的策略网络和价值网络部署到新型冷却系统控制装置上,对策略网络参数和价值网络参数进行在线优化,直至满足应用需求的真空度/过冷度控制效果。本申请将能够提高船舶新型冷却系统的控制精度、可靠性和运行效率。
技术关键词
新型冷却系统
强化学习控制方法
学习控制设备
真空度
船舶
海水换热器
离线
策略
冷凝器
网络部署
强化学习算法
循环泵
学习控制装置
在线
参数
处理单元
汽轮机乏汽
BP神经网络
系统为您推荐了相关专利信息
故障预测模型
实时数据库
学习算法
集成模块
海洋气象预报
混合动力船舶
船舶混合动力
能量管理方法
清洁能源
粒子群优化算法
预警方法
特征提取模型
动态
检测设备
遗传算法优化
干散货船舶
移动小车
机器人主体结构
抓斗卸船机
钢丝绳卷筒