基于广播新闻的方言语音识别模型语料库构建方法和装置

AITNT
正文
推荐专利
基于广播新闻的方言语音识别模型语料库构建方法和装置
申请号:CN202411878226
申请日期:2024-12-19
公开号:CN119851652B
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了基于广播新闻的方言语音识别模型语料库构建方法和装置,方法包括:获取广播新闻视频,所述广播新闻视频中具有第一字幕;对所述广播新闻视频进行音轨提取,得到广播新闻音频;根据所述广播新闻音频,计算静音点列表;根据所述静音点列表,计算自然语音起止时间列表;根据所述广播新闻视频,计算关键帧时间轴;根据所述自然语音起止时间列表和所述关键帧时间轴,生成初始语料数据集;根据所述初始语料数据集,构建方言语音识别模型语料库。本发明实现了语料库构建,提高了效率和准确率,降低了语料库管理成本。本发明可广泛应用于模型语料库技术领域。
技术关键词
语音识别模型 自然语音 关键帧 字幕 语料库构建方法 语句 列表 时间差 音频 二值化图像 像素点 数据 校正 视频帧 计算机装置 关系 模块
系统为您推荐了相关专利信息
1
一种基于语速感知的空管语音识别模型的语音识别方法
语音识别模型 语音识别方法 联合损失函数 语音识别训练 字符
2
视频生成方法、装置、设备及介质
视频生成方法 关键帧 编码器 文本 注意力
3
基于终端智能助手的问答方法及装置、电子设备
指令 深度学习模型 问答方法 意图 答案
4
语音识别方法、装置、相关设备及计算机程序产品
语音识别模型 语音识别方法 文本 计算机程序产品 发音词典
5
用于确定视频片段的方法、装置、设备和存储介质
字幕信息提取 音频特征 视觉特征 计算机可执行指令 标识
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号