摘要
本申请提供一种基于多模态反馈的工业视觉异常识别方法、系统、设备及介质,属于工业视觉检测技术领域,所述方法:实时采集产线视频流自动分割ROI区域,生成图片序列,并提取设定维度的特征,结合预先设置的动态距离阈值与特征库进行比对,初步识别异常图像;构建检测需求的提示词,再将提示词与异常相关信息输入多模态大模型,输出确定的异常图像;使用确定的异常图像构建数据集对目标检测模型进行训练,在训练过程中调整学习率;将工业场景中抓拍的图片依次输入深度学习模型、多模态大模型和目标检测模型得到识别结果,反馈到用户进行确认后添加到数据集,优化目标检测模型的训练。本发明实现了工业生产中异常图像的准确识别,识别效率高。
技术关键词
异常识别方法
多模态
深度学习模型
生成提示词
样本
图片
工业视觉检测技术
场景
索引
识别异常图像
视频流
动态
产线
分割算法
实时图像
分层
序列
系统为您推荐了相关专利信息
石墨烯超级电容器
状态估计方法
深度神经网络模型
双电层
注意力
视频理解方法
多模态
多层感知器
大语言模型
多阶段