基于多模态问答大模型的持镜机器人控制方法及系统

AITNT
正文
推荐专利
基于多模态问答大模型的持镜机器人控制方法及系统
申请号:CN202410997464
申请日期:2024-07-24
公开号:CN118664603B
公开日期:2025-05-06
类型:发明专利
摘要
本申请公开了基于多模态问答大模型的持镜机器人控制方法及系统,涉及机器人控制技术领域,方法包括:获取持镜机器人拍摄得到的图像;利用经过预先训练的多模态问答大模型获取图像对应的目标坐标;确定图像中器械尖端的坐标作为当前坐标,确定当前坐标与目标坐标之间的坐标误差;获取持镜机器人的当前关节角,根据当前关节角计算得到持镜机器人的当前末端位姿;根据坐标误差和当前末端位姿确定目标坐标对应的目标末端位姿;将目标末端位姿发送到持镜机器人,持镜机器人根据目标末端位姿进行轨迹规划并运动。可准确获取图像中器械尖端的当前坐标,利用多模态问答大模型准确预测目标坐标,根据坐标误差驱动持镜机器人,实现精准跟踪和稳定控制。
技术关键词
持镜机器人 机器人控制方法 多模态 坐标误差 图像嵌入 答案 序列 表达式 器械 相机 文本 数据 规划 机器人控制技术 矩阵 机器人控制系统 标记 关节
系统为您推荐了相关专利信息
1
一种用于接触网的洗剪吹抓异物清除方法及系统
异物清除方法 接触网 质地特征 策略 数字孪生系统
2
一种基于多模态数据的农田的气象预测方法以及系统
气象预测方法 农田 多模态 天气 气象预测系统
3
基于AI数字人的客户服务方法及系统
客户服务方法 多模态响应 安抚 策略 韵律特征
4
一种基于基因学习模型的曲艺视频标注方法
视频标注方法 音频特征提取 融合特征 特征提取网络 视觉特征
5
一种双面智能物料柜的控制方法及控制系统
双面智能 物料需求量 设备状态信息 需求预测模型 排产计划
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号