摘要
本申请涉及计算机技术领域,提供一种字幕生成方法、装置、电子设备、存储介质及计算机产品,方法包括:对待处理数据中的视频数据进行语音识别处理,得到文本序列及其包含的每一识别文本段中各字符串在视频数据中的时间戳信息;针对文本序列中的每一识别文本段分别进行文本修正,得到相应的修正文本;将文本序列中的每一识别文本段分别与对应的修正文本进行文字对齐,得到各识别文本段对应的对齐结果;根据每一识别文本段对应的对齐结果及其中各字符串在视频数据中的时间戳信息,分别确定相应识别文本段对应的修正文本的时间戳信息;基于各识别文本段对应修正文本及其时间戳信息,生成字幕文件。本申请可提高字幕生成的处理速度并提高显示准确性。
技术关键词
文本
字幕生成方法
生成字幕文件
序列
视频
数据
字幕生成装置
语音活动检测
自动语音识别
语音识别模块
电子设备
处理器
样本
对齐模块
计算机程序产品
滤波
编码