摘要
本发明是一种基于深度强化学习和自博弈策略的斜拉桥结构失效模式搜索方法。本发明涉及土木工程结构健康监测技术领域,本发明将结构系统失效模式搜索过程中基于失效概率的构件选择过程,转化为基于深度强化学习的序贯决策过程,使搜索过程不再需要复杂的失效概率计算与状态转化计算,减少“组合爆炸”问题对搜索过程的影响。本发明的自博弈策略可有效降低训练过程中对先验知识的依赖,充分发挥评分函数计算过程中每次有限元分析所得结果的作用,减少有限元分析的次数,使训练过程更加智能。
技术关键词
结构系统
深度强化学习
斜拉桥结构
蒙特卡洛树搜索
模式搜索方法
异步多进程
深度神经网络学习
节点
策略
阶段
样本
搜索模块
健康监测技术
土木工程结构
训练集
搜索系统
系统为您推荐了相关专利信息
轨道巡检设备
图像采集模块
主控模块
网络通信模块
钢轨
网络图结构
集中器
融合监测系统
监测方法
网络健康状态
强化学习策略
实时轨迹数据
轨迹特征
生成轨迹
机器人
收费管理系统
需求预测模型
深度强化学习
异构特征
计费