摘要
本发明公开了基于多模态大模型的具身机器人操作轨迹生成方法及系统,属于人工智能技术领域。方法包括:获取视觉、语言及机器人输入数据并进行预处理后分别映射至高维空间,得到视觉、语言及机器人输入向量;将上述输入向量分别输入至原始多模态大模型和专家模型中进行训练,获得初步训练好的多模态大模型和训练好的专家模型;利用生成式大模型生成对训练好的专家模型的调用数据,形成指令微调数据集输入至初步训练好的多模态大模型中进行训练,获得最终训练好的多模态大模型;基于机器人操作数据及最终训练好的多模态大模型,生成机器人操作轨迹。本申请有效解决了现有机器人操作低泛化性、低精度、难以适应多变的环境和任务需求的问题。
技术关键词
轨迹生成方法
多模态
数据
生成机器人
视觉
模型训练模块
机器人可视化
指令
机器人本体
多层感知机
轨迹生成系统
人工智能技术
处理器
存储器
点云
参数
图片
传感器
系统为您推荐了相关专利信息
检测产品表面
拍照设备
金属异物检测系统
伺服单元
图像
编码图像数据流
头戴显示设备
机器人控制方法
数据处理设备
控制机器人运动
语义分割模型
编码特征
融合多模态特征
解码
空间金字塔池化
翻译模型
翻译方法
场景
计算机设备
计算机程序产品