基于多模态问答大模型的持镜机器人控制方法及系统

正文

推荐专利

申请号：CN202410997464

申请日期：2024-07-24

公开号：CN118664603B

公开日期：2025-05-06

类型：发明专利

摘要

本申请公开了基于多模态问答大模型的持镜机器人控制方法及系统，涉及机器人控制技术领域，方法包括：获取持镜机器人拍摄得到的图像；利用经过预先训练的多模态问答大模型获取图像对应的目标坐标；确定图像中器械尖端的坐标作为当前坐标，确定当前坐标与目标坐标之间的坐标误差；获取持镜机器人的当前关节角，根据当前关节角计算得到持镜机器人的当前末端位姿；根据坐标误差和当前末端位姿确定目标坐标对应的目标末端位姿；将目标末端位姿发送到持镜机器人，持镜机器人根据目标末端位姿进行轨迹规划并运动。可准确获取图像中器械尖端的当前坐标，利用多模态问答大模型准确预测目标坐标，根据坐标误差驱动持镜机器人，实现精准跟踪和稳定控制。

技术关键词

持镜机器人机器人控制方法多模态坐标误差图像嵌入答案序列表达式器械相机文本数据规划机器人控制技术矩阵机器人控制系统标记关节

系统为您推荐了相关专利信息

一种用于接触网的洗剪吹抓异物清除方法及系统

异物清除方法接触网质地特征策略数字孪生系统

一种基于多模态数据的农田的气象预测方法以及系统

气象预测方法农田多模态天气气象预测系统

基于AI数字人的客户服务方法及系统

客户服务方法多模态响应安抚策略韵律特征

一种基于基因学习模型的曲艺视频标注方法

视频标注方法音频特征提取融合特征特征提取网络视觉特征

一种双面智能物料柜的控制方法及控制系统

双面智能物料需求量设备状态信息需求预测模型排产计划

基于多模态问答大模型的持镜机器人控制方法及系统

站点导航

APP 下载