摘要
本公开实施例涉及一种海洋结构物控制方法、装置、设备和存储介质,方法包括:获取海洋结构物的波浪环境特征参数和响应状态参数并基于控制目标任务构建状态输入向量输入控制策略生成模块得到当前时刻的连续控制动作,基于连续控制动作生成控制信号输入计算流体力学仿真模块生成下一时刻的结构响应数据,基于奖励函数通过结构响应数据和控制目标任务得到评估结果,评估结果不满足控制周期停止条件时更新状态输入向量并重复前述步骤直至满足控制周期停止条件,在控制周期结束后训练终止条件未满足,更新模块参数以下一控制周期处理,训练终止条件满足确定目标控制策略生成模块对海洋结构物控制。由此,能够满足不同控制目标任务的控制需求。
技术关键词
流体力学仿真
海洋结构物
控制策略
生成控制信号
周期
仿真环境
数据更新
深度强化学习
输入输出接口
插值算法
子模块
电子设备
参数
缓冲池
处理器