一种基于分层语义表示和聚合网络的视频字幕生成方法

正文

推荐专利

申请号：CN202410806011

申请日期：2024-06-21

公开号：CN118590598A

公开日期：2024-09-03

类型：发明专利

摘要

本发明公开了一种基于分层语义表示和聚合网络的视频字幕生成方法，该方法首先对视频进行预处理，获取视频特征。其次构建视频字幕分层语义表示和聚合网络整体架构。然后根据视频特征，在构建的视频字幕分层语义表示和聚合网络中生成字幕。最后训练视频字幕分层语义表示和聚合网络，优化网络参数。本发明显著提高了生成字幕中动词的精度和多样性。

技术关键词

视频字幕生成方法融合语义动作特征分层生成字幕上下文特征优化网络参数动作融合运动特征物体网络整体架构对象事件特征编码器解码器

一种基于分层语义表示和聚合网络的视频字幕生成方法

站点导航

APP 下载