摘要
本发明提出基于多模态大模型的土木工程结构表观损伤诊断方法。该方法包括结构表观损伤多模态数据统一表征与对齐融合,基于多模态思维链的结构损伤识别推理方法,多模态数据集构建与大模型微调,对土木工程结构损伤识别和特征描述。本发明使用多模态大模型完成对结构损伤图像的向量编码并与文本编码特征对齐,通过调用计算机视觉模型生成损伤语义分割图作为视觉思维链,并通过构造微调数据集形成语言思维链,由预训练大语言模型完成对多模态信息编码的推理和结构损伤诊断的生成。该方法使用多模态大模型为底座并融合多模态思维链推理方法,使得模型能够通过自然语言进行人机交互,高效诊断各类结构损伤,提高结构损伤诊断模型的泛化能力和准确性。
技术关键词
多模态
结构损伤诊断
损伤诊断方法
土木工程结构损伤
图像特征编码
损伤特征
大语言模型
文本
语义
对齐模块
损失函数计算方法
损伤类别
图像编码器
设计土木工程
视觉先验信息
系统为您推荐了相关专利信息
图像训练样本
图像嵌入
图像编码
图像处理模型
编码向量
三维环境地图
障碍物
激光雷达传感器
数据
无人机避障方法
分类模型训练方法
图像
白光
多模态特征融合
肿瘤