摘要
本发明公开了一种基于多模态大模型的工业机器人装配方法与系统,所述装配方法包括以下步骤:接收用户语音指令;识别语音指令及对应的语音特征,转换为文本信息输入大语言模型中;大语言模型收到输入文本后,经过自定义的prompt结构,生成视觉语言模型的交互代码;机器人使用成像装置获取场景信息,融合视觉语言模型与交互代码,还原当前场景物体的外观及空间位置,生成价值地图;根据装配任务的需求,对机器人的末端执行器执行姿态调节任务;将价值地图作输入运动规划器,生成机器人的空间移动路径;机器人沿空间移动路径移动到目标位置,执行装配任务。本发明减少了数据收集和处理的成本和时间,并提高装配工作的效率和准确性。
技术关键词
大语言模型
生成代码
多模态
运动规划器
成像装置
语音特征
场景
地图
生成机器人
语言建模方法
融合视觉
机器人模拟器
机器人末端执行器
控制工业机器人
回归预测方法
孔零件
系统为您推荐了相关专利信息
多模态特征融合
非局部均值滤波
多尺度特征提取
特征融合网络
全局直方图
大语言模型
基因识别方法
数据库查询语句
模式
组织
辅助诊断系统
图像处理模块
诊断决策支持
数据采集模块
数据分析模块
强化学习策略
智能控制系统
深度确定性策略梯度
井下设备
多模态