摘要
本申请涉及语音信号处理技术领域,其具体地公开了一种面向实际通信场景的语音带宽扩展方法,其采用“由粗到细”的双层架构,首先利用基于源滤波器模型的传统语音带宽扩展技术对窄带语音信号进行初步扩展,得到粗略扩展语音;接着构建轻量级深度神经网络模型,该模型包含编码器模块、解码器模块和轻量级分组LSTM(GLSTM)模块;在模型训练过程中,使用多尺度鉴别器进行对抗训练,优化模型性能;最后通过优化后的轻量级深度神经网络模型对粗略扩展语音进行精细化频谱优化和特征增强,输出高质量宽带语音。本申请融合传统信号处理与轻量级深度学习技术,显著降低计算复杂度,保证语音扩展的高质量,并可实时处理语音信号。
技术关键词
语音带宽扩展
轻量级深度神经网络
窄带语音信号
宽带语音信号
多尺度鉴别器
编码器模块
短时傅里叶变换
粗略
滤波器模型
场景
支路
语音信号处理技术
轻量级深度学习
解码器
扩展模块
波形
网络拓扑结构
分辨率
系统为您推荐了相关专利信息
生成对抗网络
荧光
可见光图像
形状先验信息
多模态特征融合
图像处理模型
可见光图像
荧光
生成式对抗网络
训练集
深度学习模型
监控方法
矩阵
多层次特征
变分自动编码器
语义地图
一体化系统
里程计信息
导航模块
地形特征
汽车零部件
裂纹纹理
图像处理
生成汽车
关键特征点