摘要
一种基于深度强化学习的结构主动控制随机时滞补偿方法,选定被控结构模型,建立结构振动控制系统动力学方程;确定初步控制器;增添随机时滞来模拟真实的作动器工作情况,搭建被控结构和作动器的双向通信环境;利用传感器采集的结构动态响应设置回馈函数;确定深度强化学习算法、神经网络框架、网络训练参数;搭建智能体和环境的训练交互界面;采取SAC深度强化学习算法进行智能体的训练,进行智能体的在线策略梯度更新,获取成熟智能体,嵌入动力学方程作为控制补偿器,进行控制力的补偿计算;计算成熟智能体的回馈函数,调整控制补偿信号来实现振动控制。本发明保证控制器在复杂环境下的控制性能,保证鲁棒性,属于结构振动控制领域。
技术关键词
结构主动控制
深度强化学习算法
结构振动控制系统
补偿方法
主动控制设备
结构动态响应
神经网络框架
LQG控制器
补偿器
主动控制系统
双向通信
方程
控制器设备
水平楼板
策略
传感器
系统为您推荐了相关专利信息
数据分布
客户端
策略学习方法
深度强化学习算法
卷积神经网络提取
信噪比
拦截器
信息数据处理终端
雷达接收机
网络化雷达系统
协同优化方法
波束赋形矩阵
高速铁路通信系统
信道
最大化系统
温度补偿系数
压差流量传感器
流速
流量补偿方法
气体
电网频率偏差
精确时间戳
动态权重分配
全局通信
电力系统频率调节