摘要
本发明提供一种视频摘要生成方法、装置、设备、存储介质和程序产品,涉及视频处理技术领域,该方法包括:通过对目标视频中的多个字幕分别进行语义编码,得到字幕语义编码特征向量的序列;对字幕语义编码特征向量的序列进行上下文编码,得到上下文字幕语义编码特征向量的序列;将上下文字幕语义编码特征向量的序列输入基于序列标注的能量度量注意力模块,得到上下文显著化字幕语义编码特征向量的序列;基于上下文显著化字幕语义编码特征向量的序列,确定目标视频的视频摘要生成文本。本发明可以更深入地理解字幕内容及其在视频中的意义,从而更准确地捕捉视频的核心主题和要点,以此得到更加精确和丰富的视频摘要生成文本。
技术关键词
视频摘要生成方法
字幕
序列
语义
视频摘要生成装置
非暂态计算机可读存储介质
Sigmoid函数
注意力
度量
处理器
文本
计算机程序产品
编码器
编码模块
因子
存储器
系统为您推荐了相关专利信息
共享单车
出行需求
Stacking算法
CatBoost算法
多头注意力机制
病虫害识别方法
YOLO模型
局部注意力机制
混沌粒子群
病虫害图像
智能焊接平台
数据采集方法
时序
皮尔逊相关系数
计算机程序指令