基于动态稀疏的视频理解方法、装置、设备及介质

AITNT
正文
推荐专利
基于动态稀疏的视频理解方法、装置、设备及介质
申请号:CN202510891951
申请日期:2025-06-27
公开号:CN120747824A
公开日期:2025-10-03
类型:发明专利
摘要
本申请涉及数据处理技术领域,公开了一种基于动态稀疏的视频理解方法、装置、设备及介质,该方案通过时空特征编码器对视频帧序列进行时空特征提取和转换,能够充分保留视频的时空信息,输出具有丰富语义的视频特征。利用动态稀疏注意力机制对视频语义特征进行稀疏注意力计算,根据视频内容的时空特性动态调整注意力分配,从而准确地捕捉到视频中重要的上下文信息,减少冗余计算,有效降低视频处理时的计算复杂度,从而提高视频理解的效率。通过文本生成编码器对上下文特征向量进行分析计算,实现高效精准的视频语义理解与文本描述生成,从而提高在金融领域处理海量交易数据和医疗领域处理高分辨率医学影像应用场景下的视频理解效率。
技术关键词
视频理解方法 语义特征 局部时空特征 视频帧 编码器 特征编码模型 动态 文本 序列 海量交易数据 多头注意力机制 融合特征 特征提取模型 元素 可读存储介质 数据处理技术 处理器
系统为您推荐了相关专利信息
1
一种无监督特征学习的轻量级牛肉质量评估方法
样本 数据 无监督特征学习 特征值 注意力
2
一种光测实景模拟训练方法及系统
模拟训练方法 单杆 方位角 像素 串口卡
3
文件命名方法及其装置
关键词 文件命名方法 音频 视频帧 场景分类
4
基于全程特征信息聚合的遥感图像道路提取方法
注意力 道路特征 条带 多尺度信息 遥感图像道路提取
5
一种基于扩散模型的多类机器异常声音检测方法
异常声音 高斯混合模型 数据 网络 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号