摘要
本申请提供一种训练数据获取方法及系统、语音识别方法、设备及介质,所述训练数据获取方法包括:从长视频中提取多个人声片段;计算多个所述人声片段与所述长视频的音频差值;基于所述音频差值确定有效人声片段;对所述有效人声片段进行语音识别,获取初筛识别结果;基于所述初筛识别结果确定有效转写结果;将所述有效人声片段和所述有效转写结果作为语音识别训练数据。本申请能够利用现成的长视频及其语音转写文本,构造语音识别训练数据,增强了训练数据获取效率与精度,有助于语音识别模型训练,并且不需要大量的硬件资源进行支撑。
技术关键词
训练数据获取方法
人声
语音识别训练
语音识别方法
语音识别模型
视频
音频
文本
数据获取系统
数据模块
电子设备
识别模块
可读存储介质
存储器
处理器
字符
系统为您推荐了相关专利信息
语音识别程序
蜂鸣器控制电路
语音识别报警
电网调度监控
电子定时器
骨传导传感器
采样点
信号处理模块
拾音装置
信号采集模块
智能语音问答方法
意图
语音识别模型
响应用户需求
文本