一种基于多模态大模型的人机协作机械臂控制方法

正文

推荐专利

申请号：CN202510760598

申请日期：2025-06-09

公开号：CN120552059A

公开日期：2025-08-29

类型：发明专利

摘要

本发明提出一种基于多模态大模型的人机协作机械臂控制方法，通过结合装配场景视觉信息、文本指令信息以及prompt信息输入至多模态大模型进行理解和任务分解，生成具有不同功能校验位的操作指令和机械臂控制代码。通过多模态大模型或零部件知识库检索结合DINO‑X模型得到目标物体的像素区域及坐标，根据机械臂末端执行器坐标系与视觉系统坐标系之间的映射关系，转换为机械臂的位姿坐标生成机械臂控制指令，结合具有不同功能校验位的操作指令和机械臂控制代码控制机械臂运动，实现通过多模态大模型结合语音指令、视觉信息推理决策精确、高效地生成机械臂控制指令的同时，克服多模态大模型幻觉问题导致的泛化性差和精度低的问题。

技术关键词

人机协作机械臂多模态视觉系统坐标系机械臂末端执行器控制机械臂运动物体指令像素场景字典结构文本语音特征图片关节

系统为您推荐了相关专利信息

多模态交互式智能眼镜系统及实现方法

交互式智能对象智能眼镜多模态眼镜系统

一种基于多模态感知的强化学习导航方法及系统

自主导航设备多模态传感器语义规则鱼眼摄像头生成控制指令

一种多模态课堂智能评估系统

智能评估系统视频采集单元语音识别单元多模态数据采集数据采集单元

基于多模感知和硬度触觉检测的物体分拣方法及臂手系统

柔性触觉传感器深度相机分类网络水果成熟度检测分拣方法

基于鲁棒双哈希共识学习的跨模态检索方法及系统

模态检索方法多模态样本文本特征向量图像特征向量

一种基于多模态大模型的人机协作机械臂控制方法

站点导航

APP 下载