摘要
本发明公开了基于结构感知和知识增强推理的机器人操作轨迹生成方法,属于人工智能与机器学习领域,通过获取真实机器人操作场景的采样数据以及仿真环境生成的合成数据,构建大规模多模态数据库;通过获取多源三维感知数据,输入具有结构感知能力的大语言模型,得到具有较强三维空间交互理解与动态建模能力的机器执行指令系统;通过基于空间信息理解和交互操作进行多任务渐进式训练,实现能力递进式解锁,机器人任务强定向;通过引入基于三维场景对象的大模型知识图谱增强方法辅助大模型推理,构建一个具备推理能力、结构感知能力、对复杂场景鲁棒性更强的大模型,用于机器人操作轨迹的生成。
技术关键词
轨迹生成方法
空间结构信息
机器人
场景
序列特征
状态空间模型
大语言模型
跨模态
矩阵
文本
图谱
图像
坐标
指令
多模态信息融合
多模态数据库
生成动作
语义向量空间
系统为您推荐了相关专利信息
烹饪机器人
抛光模组
抛光设备
活动架
水平旋转模组