摘要
本发明提供基于动态轻量级视觉语言模型的桥梁健康诊断方法及装置,所述方法包括:获取超清分辨率的桥梁原始图像,执行重叠式图像分区;对原始图像进行编码和余弦相似度计算,生成差异化评分并实施TopK筛选,得到动态的多尺度特征候选集;融合多尺度特征候选集,求出最佳单一尺度特征,并输出择优后的语义特征向量;接收自然语言文本提示词,将择优后的语义特征向量输入非线性投影网络,进行文本提示词与视觉特征对齐,输出多维的特征向量;将生成内容按标准协议封装,生成桥梁健康状态的诊断报告。本发明针对桥梁工程场景中的高分辨率图像的结构性损伤检测需求,通过视觉特征与文本语义的跨模态深度对齐,显著提升桥梁健康诊断的精度与可靠性。
技术关键词
健康诊断方法
视觉特征
融合多尺度特征
桥梁健康状态
自然语言文本
语义
动态
非线性
健康监测工作
报告
分区
健康诊断装置
分辨率
图像块
编码
滑动窗口机制
系统为您推荐了相关专利信息
数据
动态加权方法
词频统计
多模态
自然语言文本
房屋建筑
变形监测方法
数字孪生模型
监测传感器
节点位置信息
跨模态学习
关系建模
特征提取模块
视觉特征
模块通信
生成系统
语言编码器
融合图像特征
视觉特征
样本