一种基于时频包络引导去噪扩散过程的语音增强方法和装置

AITNT
正文
推荐专利
一种基于时频包络引导去噪扩散过程的语音增强方法和装置
申请号:CN202510861224
申请日期:2025-06-25
公开号:CN120708639A
公开日期:2025-09-26
类型:发明专利
摘要
本申请提供一种基于时频包络引导去噪扩散过程的语音增强方法和装置,包括通过神经网络获取带噪语音信号中纯净语音信号幅度谱的估计;基于纯净语音信号幅度谱的估计,提取纯净语音信号的时频包络;基于纯净语音信号的时频包络,构建纯净语音信号的包络调制噪声;包络调制噪声为基于纯净语音信号的时频包络特征,对高斯白噪声进行各项异性噪声调制获得;基于纯净语音信号的包络调制噪声,对扩散过程的扩散路径进行各向异性调整,通过扩散模型获得纯净语音信号复数谱的估计。本发明充分利用语音信号的时频特征指导扩散过程,在频域对带噪语音信号的复数谱进行各向异性扩散建模,考虑语音信号在不同时频位置的差异,有效恢复语音关键频率成分。
技术关键词
带噪语音信号 包络 协方差矩阵 噪声强度 异性 元素 短时傅里叶变换 参数 模型训练模块 计算机存储介质 噪声样本 重构模块 声道 谱估计 可读存储介质
系统为您推荐了相关专利信息
1
一种用于钠离子电池的循环寿命预测方法与系统
钠离子电池 循环寿命预测方法 寿命预测模型 神经网络模型 参数
2
一种多源干扰下的地下空间无人系统定位方法及系统
协方差矩阵 系统定位方法 构建系统模型 代表 概率密度函数
3
一种野外岩矿光谱数据预处理方法
数据预处理方法 岩矿光谱 DBSCAN算法 DBSCAN参数 优化光谱数据
4
高精度高可靠性谐波减速器齿形仿真加工设计方法
谐波减速器 柔轮变形 有限元仿真分析 疲劳寿命预测 伺服电机驱动系统
5
一种多传感器融合定位方法
传感器融合 协方差矩阵 定位方法 估计滤波器 多源信息融合
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号