基于多模态融合与视觉语言模型的机器人避障与导航方法

正文

推荐专利

申请号：CN202510780915

申请日期：2025-06-12

公开号：CN120293156B

公开日期：2025-09-05

类型：发明专利

摘要

本发明提供一种基于多模态融合与视觉语言模型的机器人避障与导航方法，该方法包括通过多种传感器实时采集不同的模态数据，并进行时间同步处理和归一化处理；提取不同模态数据的特征并通过中间层进行融合；将融合后的多模态数据输入视觉语言模型，并利用模型的语义分割和目标检测结果，生成环境的语义地图，结合自然语言指令和视觉分析结果生成行动策略，将生成的行动策略转化为机器人可执行的控制信号，实现闭环控制。本发明将视觉语言模型与多模态传感器融合技术相结合，旨在提升移动机器人在复杂动态环境下的感知、决策与实时响应能力。

技术关键词

语义地图点云特征语言编码器互补滤波器视觉模态特征导航方法卡尔曼滤波器陀螺仪数据图像采集设备时间同步自然语言多层感知机机器人解码器策略中间层节点特征交叉注意力机制

系统为您推荐了相关专利信息

一种智能化视觉检测自动分拣系统

智能分拣机器人分拣系统行走模块识别模块存储模块

视觉引导的风电叶片切割方法

风电叶片点云切割方法轨迹模板

水面漂浮物视觉识别自适应打捞机器人

打捞机器人水面漂浮物传送带视觉辊压组件

基于动态时间规整的动作纠正方法

纠正方法关节点动态时间规整算法序列轨迹

基于潦草提示的数据处理方法、装置、电子设备及介质

残差模型非线性多模态计算机执行指令注意力机制

基于多模态融合与视觉语言模型的机器人避障与导航方法

站点导航

APP 下载