基于全局记忆检索与双流动态融合的视频摘要生成方法

正文

推荐专利

申请号：CN202510753788

申请日期：2025-06-06

公开号：CN120298956B

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种基于全局记忆检索与双流动态融合的视频摘要生成方法，属于计算机视觉技术领域。所述方法包括：对输入视频帧序列进行特征提取，得到时序视频特征；将时序视频特征输入视频摘要生成模型，通过模型预测帧级重要性分数；将所述帧级重要性分数与中心置信度进行加权融合，获得最终帧级重要性得分；对所述帧级重要性得分执行时序非极大值抑制处理，抑制相邻高得分帧中的冗余帧，根据处理后的结果选择关键帧，并生成最终视频摘要。在基准数据集SumMe和TVSum上得到的实验结果证明了该方法的先进性。本发明所提出的视频摘要生成方法可以有效地提升长视频的时序建模能力和关键帧选择的准确性。

技术关键词

视频摘要生成方法语义特征时序特征 Softmax函数内存融合特征记忆矩阵乘法运算动态门控多任务注意力 Sigmoid函数关键帧计算机视觉技术融合全局

基于全局记忆检索与双流动态融合的视频摘要生成方法

站点导航

APP 下载