摘要
一种考虑随机时滞的深度强化学习主动控制参数调节方法,包括:确定被控结构模型、作动器安装位置,建立结构振动控制动力学方程;确定初步控制器;在作动器中增添随机时滞模拟真实的工作环境,搭建双向通信环境;利用传感器采集的结构响应设置的回馈函数;确定深度强化学习算法、神经网络框架、训练参数,搭建交互界面;在交互界面中对深度强化学习的智能体进行训练,通过深度强化学习算法的累积奖励期望、回馈函数数值进行策略更新迭代以获得成熟智能体;利用成熟智能体作为初步控制器中的参数调节器,实时调整参数数值,实现结构在随机时滞下的振动控制。本发明保证控制器在复杂环境下的鲁棒性,属于结构振动控制领域。
技术关键词
控制参数调节方法
深度强化学习算法
结构振动控制
LQG控制器
结构动态响应
神经网络框架
SAC算法
状态空间方程
策略更新
主动控制设备
双向通信
调节器
数值
核心算法
训练算法
界面
系统为您推荐了相关专利信息
深度强化学习方法
多智能体协同
计数表
深度强化学习算法
仿真环境
站台
深度强化学习算法
决策
神经网络参数
DQN算法
车用空气悬挂
动态分配系统
电磁阀组
气室
高压气体系统
无线接入点
相位对齐方法
反射单元
反射面
无人机三维轨迹
温度管理系统
电源适配器
氮化镓
形状记忆聚合物材料
群体智能算法