一种多模态数据的特征融合方法、系统、设备及介质

正文

推荐专利

申请号：CN202510494500

申请日期：2025-04-18

公开号：CN120408509A

公开日期：2025-08-01

类型：发明专利

摘要

本发明提供了一种多模态数据的特征融合方法、系统、设备及介质，包括：获取文本数据和视频数据，对文本数据和视频数据进行特征提取，分别得到文本特征和图像特征；将文本特征和图像特征分别划分多个文本片段和多个图像片段；构建记忆单元，使用记忆单元生成每个文本片段或图像片段的历史信息；将所有文本片段和图像片段以及对应的历史信息输入到特征提取模型中进行特征提取，得到深度文本特征和深度图像特征；将深度文本特征和深度图像特征进行融合，得到融合特征。本发明解决了现有技术中存在的对具有长距离依赖且时空特征明显的动态特征提取困难，以及多模态特征融合时，简单的特征拼接或加权平均会损失关键信息的问题。

技术关键词

特征融合方法文本记忆单元特征提取模型图像融合特征多层感知机关键帧特征融合系统多模态特征融合动态特征提取视频编码模块数据特征提取位置编码器存储计算机程序处理器

系统为您推荐了相关专利信息

基于图像识别的宠物食品颗粒成型质量检测方法及系统

宠物食品传送单元偏振光多光谱旋转编码器

一种电力部件缺陷图像生成方法、系统、设备及介质

拍摄图像数据电力设备图像生成方法种子深度学习算法

基于视觉状态空间的脑积水CT图像人工智能辅助识别方法

图像人工智能辅助识别方法分支视觉切片

一种数据处理方法、处理系统及行车记录仪

异常事件行车记录仪数据处理方法数据处理系统对象

一种基于物联网的文物安全智能监测预警方法及系统

生成对抗网络 VGG网络感知损失函数样本监测预警方法

一种多模态数据的特征融合方法、系统、设备及介质

站点导航

APP 下载