音频信号重建方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
音频信号重建方法、装置、计算机设备及存储介质
申请号:CN202510704232
申请日期:2025-05-28
公开号:CN120375839A
公开日期:2025-07-25
类型:发明专利
摘要
本申请涉及语音处理技术领域,可应用于金融及医疗领域,具体公开了一种音频信号重建方法、装置、计算机设备及存储介质。在接收到待处理音频信号时,将待处理音频信号传输至预设的音频重建模型中进行短时傅里叶变换,获得待处理音频信号对应的复杂谱;将复杂谱传输至音频重建模型的复杂谱重建层进行重建,获得重建复杂谱;对重建复杂谱进行逆短时傅里叶变换,获得并输出重建音频信号。本申请可以在复杂谱域进行重建,能够更准确、更全面地获得音频信号的特征,从而提高重建音频信号质量。将本方法应用于金融客服系统、线上医疗系统、远程会诊系统等医疗或金融业务系统中能够重建音频信号质量,确保语音沟通内容清晰,保证沟通流程顺畅。
技术关键词
音频信号重建方法 编码向量 短时傅里叶变换 编码器 计算机设备 并行特征 金融业务系统 远程会诊系统 解码器 全卷积神经网络 矢量量化器 码字 处理器 可读存储介质 客服系统 存储计算机程序
系统为您推荐了相关专利信息
1
固态硬盘的SOC芯片DFT功能的测试方法及装置
固态硬盘 测试方法 测试主机 主板 信号捕获模块
2
基于VITS的特征融合语音合成方法及装置
韵律特征 多头注意力机制 生成对抗网络 深度学习模型 神经网络模型
3
一种基于多模态相关性图对齐和多级交叉融合模型的指称多目标跟踪方法
跟踪方法 多模态 模态特征 交叉注意力机制 视频帧特征
4
一种重载群组列车电池故障监测方法、系统及设备
LightGBM模型 重构误差 编码器 电池故障检测方法 故障监测方法
5
基于预训练模型LoRA权重生成的个性化人脸图像生成方法
人脸图像生成方法 嵌入特征 多层感知机 图像编码器 解码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号