摘要
本申请涉及语音信号处理技术领域,公开了一种用于AI降噪的语音增强方法及系统,其方法包括获取室内场景下不同的人声样本、噪声样本和混响样本;对人声样本、噪声样本和混响样本进行划分;随机抽取一待处理人声和一待处理混响,将待处理人声依次经滤波处理和静音操作后,结合待处理混响进行混响操作,得到带混响人声;随机抽取一待处理噪声,将待处理噪声依次经滤波处理、信噪比调节和静音操作,得到目标噪声;基于带混响人声和目标噪声,生成带噪人声。本申请具有模拟生成的带噪人声更逼近拾音设备采集到的音频,减少了监督学习的难度,有利于取得较好的降噪结果,提高语音增强方法精度的效果。
技术关键词
人声
噪声样本
拾音设备
音频
突发噪声
稳态噪声
信噪比
语音信号处理技术
降噪模型
高通滤波器
低通滤波器
消音器
采样模块
计算机设备
场景
系统为您推荐了相关专利信息
递归神经网络
人交互方法
计算机设备
场景
生成训练数据
媒体项
媒体内容识别
非暂时性计算机可读存储器
计算机视觉
对象检测模型