基于多模态大模型的具身机器人操作轨迹生成方法及系统

AITNT
正文
推荐专利
基于多模态大模型的具身机器人操作轨迹生成方法及系统
申请号:CN202510397773
申请日期:2025-03-31
公开号:CN120023826B
公开日期:2025-10-28
类型:发明专利
摘要
本发明公开了基于多模态大模型的具身机器人操作轨迹生成方法及系统,属于人工智能技术领域。方法包括:获取视觉、语言及机器人输入数据并进行预处理后分别映射至高维空间,得到视觉、语言及机器人输入向量;将上述输入向量分别输入至原始多模态大模型和专家模型中进行训练,获得初步训练好的多模态大模型和训练好的专家模型;利用生成式大模型生成对训练好的专家模型的调用数据,形成指令微调数据集输入至初步训练好的多模态大模型中进行训练,获得最终训练好的多模态大模型;基于机器人操作数据及最终训练好的多模态大模型,生成机器人操作轨迹。本申请有效解决了现有机器人操作低泛化性、低精度、难以适应多变的环境和任务需求的问题。
技术关键词
轨迹生成方法 多模态 数据 生成机器人 视觉 模型训练模块 机器人可视化 指令 机器人本体 多层感知机 轨迹生成系统 人工智能技术 处理器 存储器 点云 参数 图片 传感器
系统为您推荐了相关专利信息
1
一种基于模板的渐进式草图模型重建方法
模型重建方法 手绘草图 参数 建模系统 模块
2
金属异物检测系统、方法、装置、设备及存储介质
检测产品表面 拍照设备 金属异物检测系统 伺服单元 图像
3
机器人控制方法、系统、设备、计算机可读介质和产品
编码图像数据流 头戴显示设备 机器人控制方法 数据处理设备 控制机器人运动
4
图像处理方法、装置、存储介质、电子设备及AR眼镜
语义分割模型 编码特征 融合多模态特征 解码 空间金字塔池化
5
业务数据的语种翻译方法、装置、计算机设备、可读存储介质和程序产品
翻译模型 翻译方法 场景 计算机设备 计算机程序产品
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号