多模态视频特征提取方法、装置、设备及介质

正文

推荐专利

申请号：CN202510828110

申请日期：2025-06-19

公开号：CN120656107A

公开日期：2025-09-16

类型：发明专利

摘要

本发明公开了一种多模态视频特征提取方法、装置、设备及介质，应用于城市管理、医疗预测和金融预测等应用场景。其中的方法通过采集设备获取原始的多模态数据，经过预处理后，采用分层多模态分解技术对各模态数据进行多尺度特征提取，生成具有丰富时空信息的分层特征。利用自适应稀疏编码对这些分层特征进行联合稀疏表示优化，动态调整稀疏阈值和字典，实现对多模态特征的高效压缩与判别力提升。将优化后的稀疏编码融合成紧凑的多模态特征向量，输出用于下游分析任务。有效解决了现有技术中因固定字典和静态融合导致的特征表达不充分问题，显著提升了多模态视频特征的表达能力和适应动态场景的能力。

技术关键词

视频特征提取方法分层特征多模态编码在线字典学习能量分布特征视频流多分辨率拉普拉斯金字塔预训练语言模型复杂度注意力机制多尺度特征提取采集设备融合特征文本音频跨模态计算机设备

系统为您推荐了相关专利信息

一种问答处理方法、装置、介质及设备

问答模型答案序列样本标识符

一种支持人机交互的积木机器人主板

积木机器人支持人机交互声音采集电路模拟麦克风陶瓷天线

一种网页信息分类方法、装置及存储介质

网页信息分类方法树形结构自动化工具神经网络模型生成特征向量

基于领域自适应的自监督目标计数微调方法及系统

视觉特征微调方法文本密度图像类别

一种天气特征目标检验方法、装置、设备、介质

天气数据检验方法编码器图像获取模块

多模态视频特征提取方法、装置、设备及介质

站点导航

APP 下载