摘要
本申请涉及语音处理技术领域,可应用于金融及医疗领域,具体公开了一种音频信号重建方法、装置、计算机设备及存储介质。在接收到待处理音频信号时,将待处理音频信号传输至预设的音频重建模型中进行短时傅里叶变换,获得待处理音频信号对应的复杂谱;将复杂谱传输至音频重建模型的复杂谱重建层进行重建,获得重建复杂谱;对重建复杂谱进行逆短时傅里叶变换,获得并输出重建音频信号。本申请可以在复杂谱域进行重建,能够更准确、更全面地获得音频信号的特征,从而提高重建音频信号质量。将本方法应用于金融客服系统、线上医疗系统、远程会诊系统等医疗或金融业务系统中能够重建音频信号质量,确保语音沟通内容清晰,保证沟通流程顺畅。
技术关键词
音频信号重建方法
编码向量
短时傅里叶变换
编码器
计算机设备
并行特征
金融业务系统
远程会诊系统
解码器
全卷积神经网络
矢量量化器
码字
处理器
可读存储介质
客服系统
存储计算机程序
系统为您推荐了相关专利信息
韵律特征
多头注意力机制
生成对抗网络
深度学习模型
神经网络模型
跟踪方法
多模态
模态特征
交叉注意力机制
视频帧特征
LightGBM模型
重构误差
编码器
电池故障检测方法
故障监测方法
人脸图像生成方法
嵌入特征
多层感知机
图像编码器
解码器