摘要
本发明涉及工业生产检测技术领域,尤指一种基于多模态模型的工业生产检测方法及系统通过解析任务描述文本与示例图像,生成包含目标位置、采集配置和检测内容的任务参数集,指导相机以适当角度和分辨率采集图像数据。随后,将所采集图像输入目标检测模型进行初步识别,获取缺陷区域和类型等标注结果。最后,结合该初步标注结果与与之对应的生产文档数据输入预构建的深度学习模型,执行多模态融合推理,输出完整的检测结果。该方法在保留视觉识别能力的同时,增强了对工艺信息的感知能力,提升了工业外观缺陷检测的适应性与智能化水平,实现质量原因的自动化追溯。
技术关键词
多模态
残差神经网络
深度学习模型
工业生产检测技术
相机
数据
外观缺陷检测
混合损失函数
图像增强
损失函数优化
设备运行参数
最小化误差
文本
样本
构建训练集
标签