具身认知大模型驱动的自主机器人多任务操作规划方法及系统

AITNT
正文
推荐专利
具身认知大模型驱动的自主机器人多任务操作规划方法及系统
申请号:CN202510687989
申请日期:2025-05-27
公开号:CN120307299A
公开日期:2025-07-15
类型:发明专利
摘要
本发明涉及一种具身认知大模型驱动的自主机器人多任务操作规划方法及系统,其中方法包括:S1、基于实时获取的RGB图和深度图进行编码得到具身视觉表征;S2、获取自然语言指令并和具身视觉表征进行跨模态融合,得到融合特征,并基于融合特征多任务分解方案;S3、基于多任务分解方案利用扩散策略生成机器人末端执行器的连续动作轨迹;S4、获取机器人按照连续动作轨迹执行后的第二RGB图像和第二深度图将其作为闭环反馈信号,系统用于实现上述方法。与现有技术相比,本发明基于具身认知大模型将视觉与语言模态的深度融合,并结合扩散策略动作决策模块预测精确的动作轨迹,显著提高了机器人在动态复杂环境中的多任务自主规划与精确执行能力。
技术关键词
自主机器人 深度图 视觉 融合特征 连续动作空间 自然语言 文本 规划 注意力 生成机器人 轨迹 机器人末端执行器 跨模态 执行多任务 序列 生成提示信息 编码
系统为您推荐了相关专利信息
1
一种基于多路监控视频分析的景区客流饱和度监测方法
饱和度监测方法 监控设备 多路监控视频 计算机视觉分析技术 分布式数据库系统
2
用于访问基于位置的工程信息的基于照片的接口
照片 子组件 坐标 交通工具 数据
3
一种波浪信息的获取方法、装置、设备及介质
堆叠方式 视频 视觉特征 视角 融合特征
4
一种基于多模态融合的机场定位方法、装置、介质及设备
多模态深度 定位方法 环境图像数据 深度神经网络 注意力机制
5
船舶工件自动组对点焊系统及方法
视觉引导装置 二次定位机构 工件 点焊系统 搬运机器人
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号