具身认知大模型驱动的自主机器人多任务操作规划方法及系统

正文

推荐专利

申请号：CN202510687989

申请日期：2025-05-27

公开号：CN120307299A

公开日期：2025-07-15

类型：发明专利

摘要

本发明涉及一种具身认知大模型驱动的自主机器人多任务操作规划方法及系统，其中方法包括：S1、基于实时获取的RGB图和深度图进行编码得到具身视觉表征；S2、获取自然语言指令并和具身视觉表征进行跨模态融合，得到融合特征，并基于融合特征多任务分解方案；S3、基于多任务分解方案利用扩散策略生成机器人末端执行器的连续动作轨迹；S4、获取机器人按照连续动作轨迹执行后的第二RGB图像和第二深度图将其作为闭环反馈信号，系统用于实现上述方法。与现有技术相比，本发明基于具身认知大模型将视觉与语言模态的深度融合，并结合扩散策略动作决策模块预测精确的动作轨迹，显著提高了机器人在动态复杂环境中的多任务自主规划与精确执行能力。

技术关键词

自主机器人深度图视觉融合特征连续动作空间自然语言文本规划注意力生成机器人轨迹机器人末端执行器跨模态执行多任务序列生成提示信息编码

系统为您推荐了相关专利信息

一种基于多路监控视频分析的景区客流饱和度监测方法

饱和度监测方法监控设备多路监控视频计算机视觉分析技术分布式数据库系统

用于访问基于位置的工程信息的基于照片的接口

照片子组件坐标交通工具数据

一种波浪信息的获取方法、装置、设备及介质

堆叠方式视频视觉特征视角融合特征

一种基于多模态融合的机场定位方法、装置、介质及设备

多模态深度定位方法环境图像数据深度神经网络注意力机制

船舶工件自动组对点焊系统及方法

视觉引导装置二次定位机构工件点焊系统搬运机器人

具身认知大模型驱动的自主机器人多任务操作规划方法及系统

站点导航

APP 下载