摘要
本发明涉及一种音素级的随机语音干扰噪声生成方法及装置,包括:通过TIMIT数据集对语句中的音素进行提取和分类,得到需要的基础音素文件;同时从VOICES数据集中提取得到高频音素文件,并与基础音素文件整合,形成干扰信号音素备选库;从音素备选库中随机提取多个片段,使用最长的音素信号作为参考长度,并在末尾用零填充所有比它短的信号以对齐长度,在时域上直接叠加,得到反录音设备的干扰信号并进行处理,从中随机抽取音素,得到完全随机的宽频带干扰信号。本发明在生成干扰信号时无需用户配合进行语音预录制,且对不同语音识别系统、不同设备均具有良好的干扰效果,与现有方案相比,具有更好的实用性和便捷性。
技术关键词
噪声生成方法
录音设备
噪声生成装置
信号处理模块
音频
宽频带
语音识别系统
数据
语句
基础
系统为您推荐了相关专利信息
智能管理方法
高维特征向量
文本特征向量
视频时空特征
基因
存储单元
存储控制模块
音频信号传输系统
外部设备
控制单元
睡眠状态检测方法
采集单元
视觉特征
音频特征
序列