一种语音信号重构方法、装置、设备及其存储介质

正文

推荐专利

申请号：CN202411707081

申请日期：2024-11-25

公开号：CN119626235A

公开日期：2025-03-14

类型：发明专利

摘要

本申请实施例属于语音处理技术领域，应用于语音信号重构场景中，涉及一种语音信号重构方法、装置、设备及其存储介质，通过识别出梅尔语谱图中所包含的所有子带特征；采用独立编码器分别对不同子带特征进行下采样处理，获得每个子带特征的低维特征向量；对每个子带特征所对应的低维特征向量进行量化处理，获得离散型数值结果；将所有子带特征对应的离散型数值结果输入到解码器中，进行上采样恢复处理，得到原始语音信号对应的重构语音波形。先对每个子带特征进行下采样处理，之后结合所有的下采样量化结果进行上采样恢复，充分利用了每个子带特征中的音频信息，使得语音高频部分重建的更加细节，保证了金融领域智能语音客服的音频合成质量。

技术关键词

语音信号重构方法独立编码器上采样解码器计算机可读指令波形傅里叶变换处理数值智能语音客服语音信号处理算法信号获取模块参数重构场景可读存储介质重构装置带通滤波器

一种语音信号重构方法、装置、设备及其存储介质

站点导航

APP 下载