基于视觉与语言模型的零样本异常检测方法、装置及设备

AITNT
正文
推荐专利
基于视觉与语言模型的零样本异常检测方法、装置及设备
申请号:CN202411946095
申请日期:2024-12-27
公开号:CN119941644B
公开日期:2025-12-19
类型:发明专利
摘要
本发明提供了一种基于视觉与语言模型的零样本异常检测方法、装置及设备,涉及异常检测技术领域,所述方法包括:从同一批次图像中获取推理图像和参考图像;通过第一多模态模型,分别对所述推理图像和所述参考图像进行双模态检测,获得初始掩码;通过第二多模态模型分别提取所述同一批次图像的特征并分别进行特征聚合,获得聚合推理特征和聚合参考特征;根据所述初始掩码,对所述聚合参考特征进行噪声特征过滤,获得非异常聚合参考特征,根据所述非异常聚合参考特征和所述聚合推理特征获得初始异常分数;根据所述初始异常分数和所述初始掩码进行掩码精炼,获得最终推理掩码,用于实现零样本异常检测。
技术关键词
异常检测方法 多模态 图像 噪声特征 双模态 视觉 文本 样本 补丁 邻域 异常检测技术 异常检测装置 存储计算机程序 中间层 模板 注意力 阶段 过滤模块 存储器
系统为您推荐了相关专利信息
1
跌倒事件识别方法、装置及介质
骨骼关键点 事件识别方法 肘关节 膝关节 姿态估计
2
一种基于仿生设计的水空跨介质无人平台多模态结构
无人平台 航行器 旋翼机构 螺旋桨导管 多模态
3
一种多任务电池储能系统故障诊断与荷电状态估计方法
电池储能系统 状态估计方法 多任务 联合损失函数 融合深度神经网络
4
基于卡尔曼滤波的医疗器械视觉跟踪方法、装置
视觉跟踪方法 手术器械 图像 腹腔镜 深度学习模型
5
一种面向生成式数字人的人体模型重光照方法
人体模型 重光照方法 多层感知机 顶点 法线贴图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号