摘要
一种考虑随机时滞的策略‑动作主动控制方法,选定被控结构的模型、作动器安装位置,建立结构振动控制系统动力学方程;增添作动器随机时滞,搭建SAC深度强化学习算法的交互环境;设置回馈函数;采用SAC算法,确定深度强化学习的神经网络的框架和网络训练参数;利用SAC算法在交互环境中对深度强化学习的智能体进行训练,通过SAC算法的经验池回放机制以及回馈函数数值进行策略更新迭代以获得成熟智能体;使用成熟智能体嵌入到步骤一的动力学方程作为控制器,直接计算出控制力信号,实现结构在随机时滞情况下的振动控制。本发明通过与环境的交互精准捕捉作动器随机时滞以及外部干扰情况,实时调整控制策略,属于结构振动控制领域。
技术关键词
主动控制方法
深度强化学习算法
结构振动控制系统
结构动态响应
主动控制设备
SAC算法
策略更新
控制器
方程
传感器
训练算法
数值
双向通信
刚度
框架
网络
控制策略
系统为您推荐了相关专利信息
辅助通信系统
数字孪生驱动
深度强化学习算法
通信方法
引导无人机
表达式
轨迹规划算法
动态
深度强化学习算法
关键点
协同优化运行方法
储能系统
能效
电力负荷需求预测
粒子群算法
模型预测控制器
电池内部温度
扩展卡尔曼滤波器
温度控制方法
观测噪声