一种基于多模态大模型的人机协作机械臂控制方法

AITNT
正文
推荐专利
一种基于多模态大模型的人机协作机械臂控制方法
申请号:CN202510760598
申请日期:2025-06-09
公开号:CN120552059A
公开日期:2025-08-29
类型:发明专利
摘要
本发明提出一种基于多模态大模型的人机协作机械臂控制方法,通过结合装配场景视觉信息、文本指令信息以及prompt信息输入至多模态大模型进行理解和任务分解,生成具有不同功能校验位的操作指令和机械臂控制代码。通过多模态大模型或零部件知识库检索结合DINO‑X模型得到目标物体的像素区域及坐标,根据机械臂末端执行器坐标系与视觉系统坐标系之间的映射关系,转换为机械臂的位姿坐标生成机械臂控制指令,结合具有不同功能校验位的操作指令和机械臂控制代码控制机械臂运动,实现通过多模态大模型结合语音指令、视觉信息推理决策精确、高效地生成机械臂控制指令的同时,克服多模态大模型幻觉问题导致的泛化性差和精度低的问题。
技术关键词
人机协作机械臂 多模态 视觉系统坐标系 机械臂末端执行器 控制机械臂运动 物体 指令 像素 场景 字典结构 文本 语音特征 图片 关节
系统为您推荐了相关专利信息
1
多模态交互式智能眼镜系统及实现方法
交互式智能 对象 智能眼镜 多模态 眼镜系统
2
一种基于多模态感知的强化学习导航方法及系统
自主导航设备 多模态传感器 语义规则 鱼眼摄像头 生成控制指令
3
一种多模态课堂智能评估系统
智能评估系统 视频采集单元 语音识别单元 多模态数据采集 数据采集单元
4
基于多模感知和硬度触觉检测的物体分拣方法及臂手系统
柔性触觉传感器 深度相机 分类网络 水果成熟度检测 分拣方法
5
基于鲁棒双哈希共识学习的跨模态检索方法及系统
模态检索方法 多模态 样本 文本特征向量 图像特征向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号