一种语音信号重构方法、装置、设备及其存储介质

AITNT
正文
推荐专利
一种语音信号重构方法、装置、设备及其存储介质
申请号:CN202411707081
申请日期:2024-11-25
公开号:CN119626235A
公开日期:2025-03-14
类型:发明专利
摘要
本申请实施例属于语音处理技术领域,应用于语音信号重构场景中,涉及一种语音信号重构方法、装置、设备及其存储介质,通过识别出梅尔语谱图中所包含的所有子带特征;采用独立编码器分别对不同子带特征进行下采样处理,获得每个子带特征的低维特征向量;对每个子带特征所对应的低维特征向量进行量化处理,获得离散型数值结果;将所有子带特征对应的离散型数值结果输入到解码器中,进行上采样恢复处理,得到原始语音信号对应的重构语音波形。先对每个子带特征进行下采样处理,之后结合所有的下采样量化结果进行上采样恢复,充分利用了每个子带特征中的音频信息,使得语音高频部分重建的更加细节,保证了金融领域智能语音客服的音频合成质量。
技术关键词
语音信号重构方法 独立编码器 上采样 解码器 计算机可读指令 波形 傅里叶变换处理 数值 智能语音客服 语音信号处理 算法 信号获取模块 参数 重构场景 可读存储介质 重构装置 带通滤波器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号