一种基于多模态视频数据的行人识别方法及系统

正文

推荐专利

申请号：CN202511022399

申请日期：2025-07-24

公开号：CN120954046A

公开日期：2025-11-14

类型：发明专利

摘要

本申请提供一种基于多模态视频数据的行人识别方法及系统，所述方法包括：获取并将多模态数据集输入至预设的特征提取模型，以使所述特征提取模型使用不同结构的神经网络分别从所述多模态数据集中提取各个行人的不同模态的特征，并将各个特征对齐融合，输出各个行人的多模态特征向量；根据各个所述多模态特征向量构建动态图结构；将所述动态图结构输入至预设的图注意力融合网络，以使所述图注意力融合网络基于多头注意力机制和各个节点之间的拓扑关系进行特征融合，获得所述动态图结构的融合特征矩阵；将所述融合特征矩阵输入至预设的推理引擎，以使所述推理引擎根据所述融合特征矩阵生成对应的行人识别结果，提高行人识别的准确性。

技术关键词

多模态行人识别方法融合特征特征提取模型多头注意力机制视觉特征数据节点特征矩阵行人识别系统视频流可见光序列特征提取模块夹角余弦网络

系统为您推荐了相关专利信息

一种基于设备指纹与动态混淆字段的短视频主动防御加密系统

加密系统切片指纹加密模块视频

基于工业元宇宙数字孪生的数字人配置方法及系统

虚拟三维模型数字孪生头戴式显示设备设备运行状态监测生产线

多模态数据的异构存储切换方法、系统、介质及电子设备

存储系统多模态切换方法 MD5算法业务系统

基于数据驱动的自然资源监测技术方法

自然资源监测技术节点数据采集单元关键词数据可视化技术

全球服务车辆维保预测方法、装置、电子设备及存储介质

多模态维保延长车辆使用寿命强化学习方法电子设备

一种基于多模态视频数据的行人识别方法及系统

站点导航

APP 下载