基于自适应多模态融合的具身智能机器人行为识别方法

正文

推荐专利

申请号：CN202511032220

申请日期：2025-07-25

公开号：CN120808036A

公开日期：2025-10-17

类型：发明专利

摘要

本发明提供一种基于自适应多模态融合的具身智能机器人行为识别方法，对输入视频由多模态特征提取模块进行特征提取分别得到RGB模态原始特征、光流模态原始特征和边缘模态原始特征；由跨模态自适应模块采用自注意力机制和交叉注意力机制实现不同模态特征的自适应对齐，得到对齐后的融合特征；得到时序编码后的特征；将时序编码后的特征通过全连接分类器预测得到行为类别；对多模态融合行为识别模型进行训练后得到训练后的模型；得到行为识别结果；本发明能够从不同维度更全面描述视频行为特征，能够实现多模态数据的有效融合与对齐，能够显著提升识别准确率，降低计算复杂度，并能够提高复杂环境下的鲁棒性。

技术关键词

智能机器人多模态特征提取器识别方法特征提取模块时序交叉注意力机制边缘检测算法输出特征分类器跨模态模态特征融合特征提取图像视频

系统为您推荐了相关专利信息

一种带有分拣机构的物流仓储系统及其使用方法

物流仓储系统分拣机构分拣平台数据传输模块识别标签

基于多源感知的高原高危作业安全监测预警系统及方法

高危作业监测预警系统多头注意力机制高原作业设备

一种基于电活性微生物检测的数据分析方法及装置

电化学系统电化学特征检测数据分析方法光谱分析模型基因序列数据

一种雪茄晾制颜色自动化监测方法、系统及介质

自动化监测方法图像颜色特征光照强度数据时序多模态

一种基于空间与语义协同的商业机会识别方法及系统

语义协同网格识别方法节点生成主题

基于自适应多模态融合的具身智能机器人行为识别方法

站点导航

APP 下载