摘要
本发明提供一种多模态缺陷检测方法、装置及设备,所述方法包括:确定基础模型,基础模型为文字‑图像分割模型;构建可训练的第一模块,第一模块用于提升基础模型对文本中裂缝描述性信息的解析能力;构建可训练的第二模块,第二模块用于提升基础模型捕捉空间上长距离依赖的能力,保全局部信息;构建可训练的第三模块,第三模块用于提升基础模型在复杂场景下的道路裂缝边缘检测能力;将第一模块、第二模块及第三模块添加至基础模型中,并训练得到道路裂缝识别模型;将待识别数据输入至道路裂缝识别模型中,得到道路裂缝识别结果,待识别数据包括文本数据和图像数据。本发明的方法能够低成本、快速准确地进行复杂场景下的多模态缺陷检测。
技术关键词
缺陷检测方法
模块
裂缝
基础
图像分割模型
边缘检测
图像编码器
多模态
数据
拉普拉斯金字塔
文本
视觉特征
注意力机制
缺陷检测装置
表达式
多层感知器
场景
系统为您推荐了相关专利信息
室内人体定位
轨迹生成方法
数据融合算法
数据采集周期
计算机视觉算法
历史功率数据
聚类
负荷特性曲线
动态时间规整
负荷预测模型
网页数据抓取
模糊匹配算法
标记
爬虫软件
文本关键词提取
数据自动标注方法
节点特征
交通流信息
交通网络建模
格拉斯曼流形