字幕生成方法、装置、电子设备、存储介质及计算机产品

正文

推荐专利

申请号：CN202510719706

申请日期：2025-05-30

公开号：CN120602735A

公开日期：2025-09-05

类型：发明专利

摘要

本申请涉及计算机技术领域，提供一种字幕生成方法、装置、电子设备、存储介质及计算机产品，方法包括：对待处理数据中的视频数据进行语音识别处理，得到文本序列及其包含的每一识别文本段中各字符串在视频数据中的时间戳信息；针对文本序列中的每一识别文本段分别进行文本修正，得到相应的修正文本；将文本序列中的每一识别文本段分别与对应的修正文本进行文字对齐，得到各识别文本段对应的对齐结果；根据每一识别文本段对应的对齐结果及其中各字符串在视频数据中的时间戳信息，分别确定相应识别文本段对应的修正文本的时间戳信息；基于各识别文本段对应修正文本及其时间戳信息，生成字幕文件。本申请可提高字幕生成的处理速度并提高显示准确性。

技术关键词

文本字幕生成方法生成字幕文件序列视频数据字幕生成装置语音活动检测自动语音识别语音识别模块电子设备处理器样本对齐模块计算机程序产品滤波编码

字幕生成方法、装置、电子设备、存储介质及计算机产品

站点导航

APP 下载