摘要
本发明提供的多尺度时空建模视频摘要生成方法及装置,包括特征提取模块、多尺度时空建模模块、重要性分类器、摘要生成模块;所述多尺度时空建模模块包括顺序自由排列的多尺度聚合器、级联时间建模模块和并行空间建模模块。本发明通过构建包括多尺度聚合器、级联时间建模模块和并行空间建模模块的多尺度时空建模模块,全面捕捉视频的局部细节和全局结构;且多尺度聚合器、级联时间建模模块和并行空间建模模块的顺序可自由排列,使得模型对不同视频特征的适应性得到了提高,使模型在保持高性能的同时,具有较低的计算复杂度。本发明具有成本低、结构简单、性能好、适应性强的优点。
技术关键词
视频摘要生成装置
视频摘要生成方法
残差学习
卷积神经网络提取
级联
特征提取模块
损失函数优化
输出特征
多尺度特征
分类器
融合策略
线性
语义
参数
索引
标签
系统为您推荐了相关专利信息
燃气轮机烟气
时域统计特征
模型建模方法
烟气含氧量
频谱特征
智能预测系统
急性肾损伤
尿液生物标志物
血流动力学参数
超声造影
通道注意力机制
特征提取模块
人体姿态估计算法
卷积神经网络提取
人体关节点