摘要
本发明公开了基于广播新闻的方言语音识别模型语料库构建方法和装置,方法包括:获取广播新闻视频,所述广播新闻视频中具有第一字幕;对所述广播新闻视频进行音轨提取,得到广播新闻音频;根据所述广播新闻音频,计算静音点列表;根据所述静音点列表,计算自然语音起止时间列表;根据所述广播新闻视频,计算关键帧时间轴;根据所述自然语音起止时间列表和所述关键帧时间轴,生成初始语料数据集;根据所述初始语料数据集,构建方言语音识别模型语料库。本发明实现了语料库构建,提高了效率和准确率,降低了语料库管理成本。本发明可广泛应用于模型语料库技术领域。
技术关键词
语音识别模型
自然语音
关键帧
字幕
语料库构建方法
语句
列表
时间差
音频
二值化图像
像素点
数据
校正
视频帧
计算机装置
关系
模块
系统为您推荐了相关专利信息
语音识别模型
语音识别方法
联合损失函数
语音识别训练
字符
语音识别模型
语音识别方法
文本
计算机程序产品
发音词典
字幕信息提取
音频特征
视觉特征
计算机可执行指令
标识