摘要
本申请实施例属于语音处理技术领域,应用于语音信号重构场景中,涉及一种语音信号重构方法、装置、设备及其存储介质,通过识别出梅尔语谱图中所包含的所有子带特征;采用独立编码器分别对不同子带特征进行下采样处理,获得每个子带特征的低维特征向量;对每个子带特征所对应的低维特征向量进行量化处理,获得离散型数值结果;将所有子带特征对应的离散型数值结果输入到解码器中,进行上采样恢复处理,得到原始语音信号对应的重构语音波形。先对每个子带特征进行下采样处理,之后结合所有的下采样量化结果进行上采样恢复,充分利用了每个子带特征中的音频信息,使得语音高频部分重建的更加细节,保证了金融领域智能语音客服的音频合成质量。
技术关键词
语音信号重构方法
独立编码器
上采样
解码器
计算机可读指令
波形
傅里叶变换处理
数值
智能语音客服
语音信号处理
算法
信号获取模块
参数
重构场景
可读存储介质
重构装置
带通滤波器