摘要
本发明公开了基于多模态去噪扩散模型的异常检测方法,属于异常检测技术领域。针对现有异常检测方法在工业质量检查中易受单模态信息局限性和特征依赖关系建模不足的影响,导致异常重建效果不佳问题,首先构建多模态大语言模型与CLIP编码器,联合生成异常语义描述,将文本模态提示嵌入去噪扩散过程;其次,设计具有四阶段层级结构的去噪UNet网络,每个阶段集成混合注意力增强Transformer模块,通过将通道级自注意力与像素注意力机制进行穿行连接,在空间和通道维度上同步捕获长程依赖关系并强化局部细节;最后通过跨模态特征对齐实现异常区域的精确重建。实验表明,本方法提升了异常图像的重建质量和异常检测的精度,在复杂的工业场景中具有较强的鲁棒性。
技术关键词
异常检测方法
多模态
深度网络模型
编码器
交叉注意力机制
图像
大语言模型
通道
模块
文本
解码器结构
噪声
缩放参数
分层
异常检测技术
阶段
像素
矩阵
系统为您推荐了相关专利信息
结构健康监测方法
复合传感器阵列
分布式应变传感器
结构健康状态
辅助监测设备
分布式人工智能
多模态融合技术
共享方法
共享系统
参数
视频时空特征
视频彩铃
语义图谱
多模态特征融合
标签生成方法
伺服比例阀
运动控制器
高频响
FPGA芯片
闭环控制方法
信息智能检索
信息检索
科技信息技术
生成用户
图谱