音频信号重建方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202510704232

申请日期：2025-05-28

公开号：CN120375839A

公开日期：2025-07-25

类型：发明专利

摘要

本申请涉及语音处理技术领域，可应用于金融及医疗领域，具体公开了一种音频信号重建方法、装置、计算机设备及存储介质。在接收到待处理音频信号时，将待处理音频信号传输至预设的音频重建模型中进行短时傅里叶变换，获得待处理音频信号对应的复杂谱；将复杂谱传输至音频重建模型的复杂谱重建层进行重建，获得重建复杂谱；对重建复杂谱进行逆短时傅里叶变换，获得并输出重建音频信号。本申请可以在复杂谱域进行重建，能够更准确、更全面地获得音频信号的特征，从而提高重建音频信号质量。将本方法应用于金融客服系统、线上医疗系统、远程会诊系统等医疗或金融业务系统中能够重建音频信号质量，确保语音沟通内容清晰，保证沟通流程顺畅。

技术关键词

音频信号重建方法编码向量短时傅里叶变换编码器计算机设备并行特征金融业务系统远程会诊系统解码器全卷积神经网络矢量量化器码字处理器可读存储介质客服系统存储计算机程序

系统为您推荐了相关专利信息

固态硬盘的SOC芯片DFT功能的测试方法及装置

固态硬盘测试方法测试主机主板信号捕获模块

基于VITS的特征融合语音合成方法及装置

韵律特征多头注意力机制生成对抗网络深度学习模型神经网络模型

一种基于多模态相关性图对齐和多级交叉融合模型的指称多目标跟踪方法

跟踪方法多模态模态特征交叉注意力机制视频帧特征

一种重载群组列车电池故障监测方法、系统及设备

LightGBM模型重构误差编码器电池故障检测方法故障监测方法

基于预训练模型LoRA权重生成的个性化人脸图像生成方法

人脸图像生成方法嵌入特征多层感知机图像编码器解码器

音频信号重建方法、装置、计算机设备及存储介质

站点导航

APP 下载