摘要
本发明提供一种基于强化学习的桥梁群维修优先级动态决策方法及装置,涉及桥梁智慧维护技术领域。该方法包括:构建桥梁网络与道路的拓扑结构;定义桥梁的状态空间、维修动作空间以及状态转移矩阵;定义桥梁的状态对应的可靠度指标,基于拓扑结构,设计基于维修成本、资产风险和交通网络容量损失风险的综合奖励函数;构建桥梁维修决策问题;将桥梁维修决策问题描述为马尔科夫决策过程,采用指针网络建立指针网络策略模型,采用Actor‑Critic算法对指针网络策略模型进行训练,获得基于强化学习的维修决策模型;对基于强化学习的维修决策模型进行训练直至收敛,输出在有限约束下桥梁维修动作排序。采用本发明可解决传统单一桥梁评估的局限性问题。
技术关键词
动态决策方法
桥梁
指针
动态决策装置
计算机可读取存储介质
策略网络模型
资产
风险
计算机可读指令
矩阵
定义
生成特征
编码器
算法
注意力机制
交通
处理器
系统为您推荐了相关专利信息
夹芯复合材料
抗弯刚度
结构设计参数
粒子群算法
设计系统
模型训练方法
功能评估方法
深度学习模型
地震
有限元分析方法