摘要
本申请公开了一种语音训练数据的获取方法、装置、设备及介质,涉及智能语音技术领域,该方法包括:多通道音频拆分为单通道;去除背景音乐和背景噪声;将多人对话音频拆分为单一说话人片段;标点添加;对质量评分差的音频进行音质增强,能够获得语料质量的语音训练数据。
技术关键词
文本
海量音频数据
语种识别
背景噪声
语音活动检测
音频失真
噪声评估模型
智能语音技术
拼音
多通道
日志
编辑
降噪模型
数据获取模块
处理器
发音
系统为您推荐了相关专利信息
监测预警系统
患者
情绪触发事件
多模态特征
识别情绪