基于自然语言对三维点云机器人引导的方法及系统

正文

推荐专利

申请号：CN202510433791

申请日期：2025-04-08

公开号：CN119927932B

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了基于自然语言对三维点云机器人引导的方法及系统，基于Transformer架构的机器人，设置动作位置t，将所述动作位置t的视觉图像数据转换为三维点云以及标准化输入，并进行下采样，完成数据预处理；基于数据预处理，将生成的预处理数据的点云进行编码，提取点云的空间特征，生成视觉信息；并通过对自然语言指令进行向量嵌入，将自然语言指令表示成模型能够理解和处理的向量，生成文本信息；基于视觉信息和文本信息，通过注意力机制将生成的视觉信息和上下文信息融合；基于上下文信息的融合，通过预测热图和偏移量，预测动作位置步骤的三维位置，提高了机器人对复杂指令的理解和执行能力以及机器人未来动作预测的准确性。

技术关键词

自然语言注意力机制机器人点云信息文本融合视觉指令采样方法编码器数据工具包动作模块线性物体邻居邻域

系统为您推荐了相关专利信息

一种基于大模型的恶意投诉识别方法、装置、设备及介质

投诉识别方法分词语音通话系统文本声学特征

基于私有数据的智能对话方法、系统、设备及存储介质

智能对话方法大语言模型社交平台通讯工具智能对话装置

用于粮库巡检机器人及其控制系统

巡检机器人机器人本体动力臂多功能机械臂可视探头

图像识别方法及系统、图像识别模型、电子设备

图像识别模型图像识别方法注意力机制卷积模块特征提取模块

基于IMU与激光雷达并结合因子图的四足机器人大场景定位与建图方法

因子四足机器人激光雷达数据机器人位姿激光里程计

基于自然语言对三维点云机器人引导的方法及系统

站点导航

APP 下载