摘要
本申请涉及一种基于轻量化多模态大模型的机器人感知与决策方法。所述方法包括:构建语义体素地图;基于所述语义体素地图采集多模态数据并进行预处理,所述多模态数据包括视觉数据、点云数据与目标语义标签;对预处理之后的多模态数据进行特征提取,并进行动态跨模态注意力融合,得到多模态融合特征;将所述多模态数据同时输入轻量化多模态大模型,进行语义化解析,得到全局空间物体语义描述;基于所述全局空间物体语义描述、目标与方向嵌入向量和多模态融合特征,采用强化学习算法进行分层导航决策,得到目标决策,其中,所述目标与方向嵌入向量为预处理之后的目标语义标签。提高了复杂场景中机器人感知与导航决策的准确率、及时性与适应性。
技术关键词
决策方法
语义标签
融合特征
强化学习算法
机器人
融合多模态特征
跨模态
地图
物体
分层
多模态数据采集
注意力机制
卷积特征提取
语义特征
语义分割网络
系统为您推荐了相关专利信息
新能源船舶
精度校准
数据预处理算法
焊接接头
误差修正算法
保护自锁电路
保护自锁装置
开关单元
脉宽调制信号
自锁模块
跳跃机器人
电机控制模块
定位螺钉
铰链组件
下支板
神经网络架构
混合编码器
自动识别系统
上采样
异常点