一种机器人视觉语言导航的动作自适应方法和系统

正文

推荐专利

申请号：CN202410784417

申请日期：2024-06-18

公开号：CN118832572B

公开日期：2025-02-28

类型：发明专利

摘要

本发明涉及一种机器人视觉语言导航的动作自适应方法和系统，包括：确定机器人可行动作空间数值范围，并生成随机动作；基于随机动作与环境交互所得变化，利用机器人动作影响自编码模块得到动作嵌入向量；基于动作嵌入向量，对比数据集中特定动作并计算差异，确定当前执行动作及对应的语义含义；基于确定性的动作与环境交互所得，利用交叉模态注意力特征提取模块，得到机器人视觉语言多模态特征；基于机器人视觉语言多模态特征，作为扩散策略决策模块条件，迭代推理出机器人下一步执行动作；对机器人状态进行更新，直至到达目标结束本次导航任务。与现有技术相比，本发明具有增强机器人动作自适应的鲁棒性和准确性等优点。

技术关键词

机器人视觉多模态特征自然语言特征提取模块交叉注意力机制编码模块机器人状态信息视觉特征提取图片指令视角数值记忆生成随机语义

系统为您推荐了相关专利信息

一种电网故障处置知识库管理系统

电网故障处置知识库管理系统语句知识图谱构建生成图谱

一种基于机器视觉的输电线路机器人故障定位方法及系统

输电线路机器人故障定位方法视觉热力图融合特征

一种图像数字化的方法、系统、设备及存储介质

图像变形映射关系参数色彩校正模块三维表面形貌

在分布式环境中调整应用的代码库和更新应用的方法和系统

代码库分布式环境依赖关系信息站点自然语言文本

检索增强生成方法、装置、电子设备及存储介质

文本语句逻辑生成方法一致性检测

一种机器人视觉语言导航的动作自适应方法和系统

站点导航

APP 下载