摘要
本发明涉及一种基于全局与局部卷积注意力机制的视频摘要方法,包括:下采样待处理的视频文件,获得视频帧,通过视频帧,使用卷积神经网络进行特征提取得到视频帧的特征向量,组成待处理视频文件的特征矩阵;将特征矩阵输入到全局与局部卷积注意力机制模型中,计算视频每一帧的重要性得分;基于每一帧的重要性分数及背包算法获取关键帧索引;通过关键帧索引提取所述待处理视频文件中的关键帧并组成视频摘要。本发明可以高效地总结视频文件得到视频摘要,将视频文件中的关键信息提取出来,帮助用户快速理解视频内容提高信息检索的效率,同时提高了视频摘要算法的计算速度。
技术关键词
视频摘要方法
注意力机制
矩阵
关键帧
视频帧特征
背包算法
索引
编码
双线性插值
摘要算法
信息检索
模块
上采样
尺寸
网络
指标
系统为您推荐了相关专利信息
视频管理方法
文本特征向量
场景特征
注意力
跨模态
光电跟踪转台
协方差矩阵
坐标系
观测噪声
航向陀螺