一种用于机器人视觉动作预测的联合去噪方法

正文

推荐专利

申请号：CN202510781781

申请日期：2025-06-12

公开号：CN120707419A

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种用于机器人视觉动作预测的联合去噪方法，通过融合深度相机采集的图像和深度图、Piper机械臂CAN线通信采集的动作数据以及Gelsight Mini触觉传感器采集的触觉图像，构建统一的生成模型。该方法包括数据采集与输入编码、联合去噪与生成两大步骤：首先将多模态数据编码为低维潜在表示，随后通过基于Transformer的联合去噪框架协同预测未来图像、深度图、触觉数据及机器人动作。创新性引入掩码自注意力机制，动态调整模态间信息交互，并利用触觉反馈指导动作生成，提升力控制精度。模型采用去噪扩散概率损失函数联合优化多模态预测，确保输出一致性。本发明显著提高机器人灵巧操作的鲁棒性和准确性。

技术关键词

联合去噪方法机器人视觉注意力机制触觉传感器图像深度相机多模态深度图编码生成高分辨率数据编码器触觉特征噪声触觉信息标记末端执行器

一种用于机器人视觉动作预测的联合去噪方法

站点导航

APP 下载