摘要
本申请公开了一种融合视觉语言的工业物联网零件分拣方法、设备及介质,涉及工业物联网领域,该方法包括:将各待分拣零件的原始图像输入至视觉编码器中,输出对应待分拣零件的视觉特征向量;将用户分拣指令输入指令编码器,输出待分拣零件的语义特征向量序列;指令编码器是利用第二训练集对预训练大语言模型进行训练得到的;对待分拣零件的语义特征向量序列和待分拣零件的视觉特征向量进行匹配,得到对应的匹配图像‑文本对;基于所述匹配图像‑文本对,生成机械臂的控制信号,机械臂根据所述控制信号完成待分拣零件的分拣。本申请能够提升零件分拣效率和零件识别能力。
技术关键词
零件分拣方法
工业物联网
融合视觉
语义
卷积神经网络模型
编码器
文本
图像
序列
大语言模型
指令
机械臂
前馈神经网络
解码器
训练集
处理器
信号
数据
系统为您推荐了相关专利信息
序列异常检测方法
双向长短期记忆网络
词语
半监督异常检测方法
框架
土地利用分类方法
语义先验
多模态特征
影像
驱动特征
管控方法
产线设备
激光扫描设备
仿真环境
点云特征
加密系统
数据采集模块
加密策略
网络流量数据
AI算法
序列设计方法
解码器
多层感知机
计算机程序产品
瓶颈