一种基于分层语义表示和聚合网络的视频字幕生成方法

AITNT
正文
推荐专利
一种基于分层语义表示和聚合网络的视频字幕生成方法
申请号:CN202410806011
申请日期:2024-06-21
公开号:CN118590598A
公开日期:2024-09-03
类型:发明专利
摘要
本发明公开了一种基于分层语义表示和聚合网络的视频字幕生成方法,该方法首先对视频进行预处理,获取视频特征。其次构建视频字幕分层语义表示和聚合网络整体架构。然后根据视频特征,在构建的视频字幕分层语义表示和聚合网络中生成字幕。最后训练视频字幕分层语义表示和聚合网络,优化网络参数。本发明显著提高了生成字幕中动词的精度和多样性。
技术关键词
视频字幕生成方法 融合语义 动作特征 分层 生成字幕 上下文特征 优化网络参数 动作融合 运动特征 物体 网络整体架构 对象 事件特征 编码器 解码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号