摘要
本申请适用于计算机技术领域,提供了一种视频关键帧的确定方法、装置、终端设备及计算机程序产品,其中,方法包括:获取目标视频帧中多个层面的预训练特征;根据每个层面的预训练特征,获取每个层面的多角度特征;根据每个层面的多角度特征,获得每个层面的多角度融合特征;根据每个层面的多角度融合特征,获得目标视频帧的帧级融合特征;基于帧级融合特征,确定目标视频帧的视频关键帧并输出。本申请实施例可以有效提高视频关键帧定位和抽取的准确性,有利于提高对视频基于视频关键帧进行后续处理的质量和效率。
技术关键词
融合特征
注意力
多角度
关键帧
训练特征
密度峰值聚类算法
计算机程序产品
场景特征
音频特征
字符
终端设备
视频帧
对象
运动
处理器
模块