摘要
本发明公开了一种融合三维可变形模型的结构位移视觉识别方法及系统,方法包括:通过消费级单目相机采集工程结构振动视频数据,建立三维可变形网格模型并生成位姿渲染图像以及位移值数据;去除环境噪声干扰;通过光流模型估计渲染图像中的稠密光流数据,构建包含位姿信息的光流特征数据集;输入两组数据序列整体结构图像序列和局部结构图像序列,经过卷积层的多层卷积操作后,分别生成对应的整体特征与局部特征;再经过线性变换生成其特征查询向量、键向量和值向量,并根据这些向量在两种特征之间建立动态权重,得到两种融合特征后进行全局平均池化,通过多层感知器输出位姿估计值。实现了仅通过单目消费级相机即可精确识别三维结构的位移。
技术关键词
视觉识别方法
光流模型
交叉注意力机制
稠密光流
可变形网格
融合特征
位移估计方法
图像
全局平均池化
多层感知器
单目相机
语义分割模型
掩膜
识别三维结构
表达式
融合局部特征
序列
数据计算方法
环境噪声干扰
系统为您推荐了相关专利信息
筛查方法
深度学习模型
预训练模型
文库
交叉注意力机制
无人机导航方法
地标
六自由度动力学模型
交叉注意力机制
自然语言
命名实体识别方法
融合知识图谱
预训练语言模型
交叉注意力机制
学生
储能电池组
光伏阵列
故障预测方法
光储系统
储能变流器
激光雷达点云数据
语义分割方法
解码模块
交叉注意力机制
融合特征