摘要
本发明涉及人工智能技术领域,可运用于医疗领域和金融科技领域,公开了多模态视频特征提取方法、装置、设备及存储介质,应用于金融单据自动化处理场景中,或可应用于医学影像辅助诊断场景中,其中方法包括:获取初始多模态数据,对其进行预处理,将预处理后多模态数据进行特征提取得到多模态特征向量;通过时序融合网络将多模态特征向量进行低秩分解,生成压缩状态;根据压缩状态和多模态特征向量计算相关性得分,根据相关性得分进行资源分配和状态加权更新,得到融合状态;基于融合状态对多模态特征向量中的各个模态特征向量进行量化,得到目标量化特征;将不同的目标量化特征进行融合生成目标多模态特征。本发明提高了特征提取的精度和效率。
技术关键词
视频特征提取方法
音频
数据
文本特征向量
多模态特征
医学影像辅助诊断
视觉
资源分配模块
时序
多层感知器
可读存储介质
特征提取模块
人工智能技术
记忆单元
网络
系统为您推荐了相关专利信息
深度卷积神经网络
网络单元
注意力
卷积模块
通道
移动机器人
导航传感器
组合体结构
组合装置
对接装置
同步搜索方法
特征数据库
隐性特征
多平台
关键词
数据传输延迟
监测信息处理方法
健康监测终端
健康监测数据
考勤设备
性能预测方法
力学性能参数
水平集函数
水平集方法
训练神经网络模型