摘要
本申请提供一种基于多模态视频数据的行人识别方法及系统,所述方法包括:获取并将多模态数据集输入至预设的特征提取模型,以使所述特征提取模型使用不同结构的神经网络分别从所述多模态数据集中提取各个行人的不同模态的特征,并将各个特征对齐融合,输出各个行人的多模态特征向量;根据各个所述多模态特征向量构建动态图结构;将所述动态图结构输入至预设的图注意力融合网络,以使所述图注意力融合网络基于多头注意力机制和各个节点之间的拓扑关系进行特征融合,获得所述动态图结构的融合特征矩阵;将所述融合特征矩阵输入至预设的推理引擎,以使所述推理引擎根据所述融合特征矩阵生成对应的行人识别结果,提高行人识别的准确性。
技术关键词
多模态
行人识别方法
融合特征
特征提取模型
多头注意力机制
视觉特征
数据
节点特征
矩阵
行人识别系统
视频流
可见光
序列
特征提取模块
夹角余弦
网络
系统为您推荐了相关专利信息
虚拟三维模型
数字孪生
头戴式显示设备
设备运行状态
监测生产线
自然资源监测技术
节点
数据采集单元
关键词
数据可视化技术
多模态
维保
延长车辆使用寿命
强化学习方法
电子设备