摘要
本申请公开了一种数据生成方法、模型训练方法、语音识别方法、装置、设备、存储介质和程序产品,涉及人工智能技术领域,包括:在存储有在需求场景中采集的多条清晰语音数据和多条噪声数据的数据集中,读取一条清晰语音数据和一条噪声数据,基于随机选择的信噪比以及场景信息对读取的一条清晰语音数据和一条噪声数据进行处理,得到一条带噪语音数据;场景信息包括:需求场景的空间属性、声源属性、收音装置在空间中的位置;得到的一条带噪语音数据为收音装置所在位置处的音频数据。本申请得到的带噪语音数据是与需求场景和随机选择的信噪比相匹配的,基于带噪语音数据训练得到的语音识别模型在噪声环境中的准确率和鲁棒性更高。
技术关键词
噪声数据
语音识别模型
收音装置
模型训练方法
数据生成方法
语音识别方法
场景
信噪比
编码特征
电子设备
计算机可读指令
识别语音数据
数据生成装置
仿真模型
语音识别装置
数据读取模块
模型训练装置
音频
系统为您推荐了相关专利信息
动态管理系统
转移概率矩阵
模糊隶属函数
模糊聚类算法
噪声数据
数据生成模型
波形
数据生成方法
数据生成系统
线路