一种语音训练数据的获取方法、装置、设备及介质

正文

推荐专利

申请号：CN202510147634

申请日期：2025-02-11

公开号：CN119993196B

公开日期：2025-07-04

类型：发明专利

摘要

本申请公开了一种语音训练数据的获取方法、装置、设备及介质，涉及智能语音技术领域，该方法包括：多通道音频拆分为单通道；去除背景音乐和背景噪声；将多人对话音频拆分为单一说话人片段；标点添加；对质量评分差的音频进行音质增强，能够获得语料质量的语音训练数据。

技术关键词

文本海量音频数据语种识别背景噪声语音活动检测音频失真噪声评估模型智能语音技术拼音多通道日志编辑降噪模型数据获取模块处理器发音

系统为您推荐了相关专利信息

分段矩阵内存计算机电子设备校准

监测预警系统患者情绪触发事件多模态特征识别情绪

文本答案模型评测方法字段标识

嵌入方法编码模块协方差矩阵复杂度语义

大语言模型图片对齐方法语义特征标记