一种机器人视觉语言导航的动作自适应方法和系统

AITNT
正文
推荐专利
一种机器人视觉语言导航的动作自适应方法和系统
申请号:CN202410784417
申请日期:2024-06-18
公开号:CN118832572B
公开日期:2025-02-28
类型:发明专利
摘要
本发明涉及一种机器人视觉语言导航的动作自适应方法和系统,包括:确定机器人可行动作空间数值范围,并生成随机动作;基于随机动作与环境交互所得变化,利用机器人动作影响自编码模块得到动作嵌入向量;基于动作嵌入向量,对比数据集中特定动作并计算差异,确定当前执行动作及对应的语义含义;基于确定性的动作与环境交互所得,利用交叉模态注意力特征提取模块,得到机器人视觉语言多模态特征;基于机器人视觉语言多模态特征,作为扩散策略决策模块条件,迭代推理出机器人下一步执行动作;对机器人状态进行更新,直至到达目标结束本次导航任务。与现有技术相比,本发明具有增强机器人动作自适应的鲁棒性和准确性等优点。
技术关键词
机器人视觉 多模态特征 自然语言 特征提取模块 交叉注意力机制 编码模块 机器人状态信息 视觉特征提取 图片 指令 视角 数值 记忆 生成随机 语义
系统为您推荐了相关专利信息
1
一种电网故障处置知识库管理系统
电网故障处置 知识库管理系统 语句 知识图谱构建 生成图谱
2
一种基于机器视觉的输电线路机器人故障定位方法及系统
输电线路机器人 故障定位方法 视觉 热力图 融合特征
3
一种图像数字化的方法、系统、设备及存储介质
图像 变形映射关系 参数 色彩校正模块 三维表面形貌
4
在分布式环境中调整应用的代码库和更新应用的方法和系统
代码库 分布式环境 依赖关系信息 站点 自然语言文本
5
检索增强生成方法、装置、电子设备及存储介质
文本 语句 逻辑 生成方法 一致性检测
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号