多模态视频特征提取方法、装置、设备及介质

AITNT
正文
推荐专利
多模态视频特征提取方法、装置、设备及介质
申请号:CN202510828110
申请日期:2025-06-19
公开号:CN120656107A
公开日期:2025-09-16
类型:发明专利
摘要
本发明公开了一种多模态视频特征提取方法、装置、设备及介质,应用于城市管理、医疗预测和金融预测等应用场景。其中的方法通过采集设备获取原始的多模态数据,经过预处理后,采用分层多模态分解技术对各模态数据进行多尺度特征提取,生成具有丰富时空信息的分层特征。利用自适应稀疏编码对这些分层特征进行联合稀疏表示优化,动态调整稀疏阈值和字典,实现对多模态特征的高效压缩与判别力提升。将优化后的稀疏编码融合成紧凑的多模态特征向量,输出用于下游分析任务。有效解决了现有技术中因固定字典和静态融合导致的特征表达不充分问题,显著提升了多模态视频特征的表达能力和适应动态场景的能力。
技术关键词
视频特征提取方法 分层特征 多模态 编码 在线字典学习 能量分布特征 视频流 多分辨率 拉普拉斯金字塔 预训练语言模型 复杂度 注意力机制 多尺度特征提取 采集设备 融合特征 文本 音频 跨模态 计算机设备
系统为您推荐了相关专利信息
1
一种问答处理方法、装置、介质及设备
问答模型 答案 序列 样本 标识符
2
一种支持人机交互的积木机器人主板
积木机器人 支持人机交互 声音采集电路 模拟麦克风 陶瓷天线
3
一种网页信息分类方法、装置及存储介质
网页信息分类方法 树形结构 自动化工具 神经网络模型 生成特征向量
4
基于领域自适应的自监督目标计数微调方法及系统
视觉特征 微调方法 文本 密度 图像类别
5
一种天气特征目标检验方法、装置、设备、介质
天气 数据 检验方法 编码器 图像获取模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号