一种用于机器人抓取操作场景的隐空间世界模型构建方法及其相关设备

正文

推荐专利

申请号：CN202510720924

申请日期：2025-05-30

公开号：CN120620180A

公开日期：2025-09-12

类型：发明专利

摘要

本申请属于人工智能技术领域，公开了一种用于机器人抓取操作场景的隐空间世界模型构建方法及其相关设备。该方法包括通过图像语义分割网络对场景图像进行语义分割，生成各物体的语义分割掩码；通过多任务场景理解网络对语义分割掩码进行处理，生成隐式表示；基于当前时刻各物体的隐式表示和机械臂动作信息，通过状态转移网络预测下一时刻隐式表示；根据预测的下一时刻隐式表示，通过多任务场景理解网络架构中的解码器生成场景分割图像重建结果、物体存在性判断结果及接触关系判断结果，构建场景的隐空间世界模型。基于上述方法，实现了对机器人抓取操作场景的高效表征与动态预测，提升了模型在复杂环境下的泛化能力和多任务协同效率。

技术关键词

图像语义分割网络机器人抓取多任务物体图像重建图像解码器多尺度特征提取模型构建方法感知特征生成动作生成场景动作特征网络架构生成工作编码模块关系

系统为您推荐了相关专利信息

一种基于人脸口罩检测模型的面部识别系统

面部识别系统口罩多任务神经网络样本生成对抗网络

宠物行为的预测方法、装置、设备和存储介质

融合特征多模态特征融合文本音频统计特征

一种高效精准的调频网印刷色彩管理配色辅助系统

色彩管理辅助系统深度卷积神经网络预测多光谱成像设备图像采集模块

一种低空飞行安全协导系统

移动物体障碍物启发式搜索算法线段预测时间间隔

一种基于边界反弹特性的多模态机械波检测方法及系统

波形反射特征信号线性回归模型激光多普勒测振仪

一种用于机器人抓取操作场景的隐空间世界模型构建方法及其相关设备

站点导航

APP 下载