基于广播新闻的方言语音识别模型语料库构建方法和装置

正文

推荐专利

申请号：CN202411878226

申请日期：2024-12-19

公开号：CN119851652B

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了基于广播新闻的方言语音识别模型语料库构建方法和装置，方法包括：获取广播新闻视频，所述广播新闻视频中具有第一字幕；对所述广播新闻视频进行音轨提取，得到广播新闻音频；根据所述广播新闻音频，计算静音点列表；根据所述静音点列表，计算自然语音起止时间列表；根据所述广播新闻视频，计算关键帧时间轴；根据所述自然语音起止时间列表和所述关键帧时间轴，生成初始语料数据集；根据所述初始语料数据集，构建方言语音识别模型语料库。本发明实现了语料库构建，提高了效率和准确率，降低了语料库管理成本。本发明可广泛应用于模型语料库技术领域。

技术关键词

语音识别模型自然语音关键帧字幕语料库构建方法语句列表时间差音频二值化图像像素点数据校正视频帧计算机装置关系模块

系统为您推荐了相关专利信息

一种基于语速感知的空管语音识别模型的语音识别方法

语音识别模型语音识别方法联合损失函数语音识别训练字符

视频生成方法、装置、设备及介质

视频生成方法关键帧编码器文本注意力

基于终端智能助手的问答方法及装置、电子设备

指令深度学习模型问答方法意图答案

语音识别方法、装置、相关设备及计算机程序产品

语音识别模型语音识别方法文本计算机程序产品发音词典

用于确定视频片段的方法、装置、设备和存储介质

字幕信息提取音频特征视觉特征计算机可执行指令标识

基于广播新闻的方言语音识别模型语料库构建方法和装置

站点导航

APP 下载