一种基于分层语义表示和聚合网络的视频字幕生成方法
站点导航
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
AI需求对接
APP 下载
iOS 下载
安卓下载
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
清空
确定
AITNT
正文
推荐专利
一种基于分层语义表示和聚合网络的视频字幕生成方法
申请号:
CN202410806011
申请日期:
2024-06-21
公开号:
CN118590598A
公开日期:
2024-09-03
类型:
发明专利
摘要
本发明公开了一种基于分层语义表示和聚合网络的视频字幕生成方法,该方法首先对视频进行预处理,获取视频特征。其次构建视频字幕分层语义表示和聚合网络整体架构。然后根据视频特征,在构建的视频字幕分层语义表示和聚合网络中生成字幕。最后训练视频字幕分层语义表示和聚合网络,优化网络参数。本发明显著提高了生成字幕中动词的精度和多样性。
技术关键词
视频字幕生成方法
融合语义
动作特征
分层
生成字幕
上下文特征
优化网络参数
动作融合
运动特征
物体
网络整体架构
对象
事件特征
编码器
解码器
沪ICP备2023015588号