多模态视频特征提取方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510849588

申请日期：2025-06-23

公开号：CN120747817A

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及人工智能技术领域，可运用于医疗领域和金融科技领域，公开了多模态视频特征提取方法、装置、设备及存储介质，应用于金融单据自动化处理场景中，或可应用于医学影像辅助诊断场景中，其中方法包括：获取初始多模态数据，对其进行预处理，将预处理后多模态数据进行特征提取得到多模态特征向量；通过时序融合网络将多模态特征向量进行低秩分解，生成压缩状态；根据压缩状态和多模态特征向量计算相关性得分，根据相关性得分进行资源分配和状态加权更新，得到融合状态；基于融合状态对多模态特征向量中的各个模态特征向量进行量化，得到目标量化特征；将不同的目标量化特征进行融合生成目标多模态特征。本发明提高了特征提取的精度和效率。

技术关键词

视频特征提取方法音频数据文本特征向量多模态特征医学影像辅助诊断视觉资源分配模块时序多层感知器可读存储介质特征提取模块人工智能技术记忆单元网络

系统为您推荐了相关专利信息

基于深度卷积神经网络的滚动轴承故障诊断方法及装置

深度卷积神经网络网络单元注意力卷积模块通道

一种多移动机器人组合体组合装置及其控制方法

移动机器人导航传感器组合体结构组合装置对接装置

多平台候选人信息智能同步搜索方法及系统

同步搜索方法特征数据库隐性特征多平台关键词

基于物联网的多源健康监测信息处理方法以及系统

数据传输延迟监测信息处理方法健康监测终端健康监测数据考勤设备

基于水平集的非均质微结构性能预测方法

性能预测方法力学性能参数水平集函数水平集方法训练神经网络模型

多模态视频特征提取方法、装置、设备及存储介质

站点导航

APP 下载