摘要
本申请提供一种基于时频包络引导去噪扩散过程的语音增强方法和装置,包括通过神经网络获取带噪语音信号中纯净语音信号幅度谱的估计;基于纯净语音信号幅度谱的估计,提取纯净语音信号的时频包络;基于纯净语音信号的时频包络,构建纯净语音信号的包络调制噪声;包络调制噪声为基于纯净语音信号的时频包络特征,对高斯白噪声进行各项异性噪声调制获得;基于纯净语音信号的包络调制噪声,对扩散过程的扩散路径进行各向异性调整,通过扩散模型获得纯净语音信号复数谱的估计。本发明充分利用语音信号的时频特征指导扩散过程,在频域对带噪语音信号的复数谱进行各向异性扩散建模,考虑语音信号在不同时频位置的差异,有效恢复语音关键频率成分。
技术关键词
带噪语音信号
包络
协方差矩阵
噪声强度
异性
元素
短时傅里叶变换
参数
模型训练模块
计算机存储介质
噪声样本
重构模块
声道
谱估计
可读存储介质
系统为您推荐了相关专利信息
钠离子电池
循环寿命预测方法
寿命预测模型
神经网络模型
参数
协方差矩阵
系统定位方法
构建系统模型
代表
概率密度函数
数据预处理方法
岩矿光谱
DBSCAN算法
DBSCAN参数
优化光谱数据
谐波减速器
柔轮变形
有限元仿真分析
疲劳寿命预测
伺服电机驱动系统
传感器融合
协方差矩阵
定位方法
估计滤波器
多源信息融合