一种基于多模态反馈的工业视觉异常识别方法、系统、设备及介质

正文

推荐专利

申请号：CN202510516982

申请日期：2025-04-23

公开号：CN120635762A

公开日期：2025-09-12

类型：发明专利

摘要

本申请提供一种基于多模态反馈的工业视觉异常识别方法、系统、设备及介质，属于工业视觉检测技术领域，所述方法：实时采集产线视频流自动分割ROI区域，生成图片序列，并提取设定维度的特征，结合预先设置的动态距离阈值与特征库进行比对，初步识别异常图像；构建检测需求的提示词，再将提示词与异常相关信息输入多模态大模型，输出确定的异常图像；使用确定的异常图像构建数据集对目标检测模型进行训练，在训练过程中调整学习率；将工业场景中抓拍的图片依次输入深度学习模型、多模态大模型和目标检测模型得到识别结果，反馈到用户进行确认后添加到数据集，优化目标检测模型的训练。本发明实现了工业生产中异常图像的准确识别，识别效率高。

技术关键词

异常识别方法多模态深度学习模型生成提示词样本图片工业视觉检测技术场景索引识别异常图像视频流动态产线分割算法实时图像分层序列

系统为您推荐了相关专利信息

一种基于人工智能的软件开发辅助系统

排版软件开发辅助系统界面模版框架

石墨烯超级电容器的荷电状态估计方法

石墨烯超级电容器状态估计方法深度神经网络模型双电层注意力

基于隐表示的非完整多模态深度聚类方法、装置和计算机设备

多模态深度样本聚类方法数据标签矩阵

一种企业销售数据的快速提取方法、设备及介质

数据分析算法企业图表关键词文本

一种基于多模态大模型的运动视频理解方法及装置

视频理解方法多模态多层感知器大语言模型多阶段

一种基于多模态反馈的工业视觉异常识别方法、系统、设备及介质

站点导航

APP 下载