一种音频处理方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
一种音频处理方法、装置、电子设备及存储介质
申请号:CN202411053243
申请日期:2024-08-02
公开号:CN118571238B
公开日期:2024-11-12
类型:发明专利
摘要
本申请提供了一种音频处理方法、装置、电子设备及存储介质,包括:将待处理音频输入至语音处理模型的编码器网络层之中,对待处理音频的特征向量进行固定维度编码处理,输出待处理音频的离散化特征向量;将离散化特征向量输入至量化器网络层之中,对离散化特征向量进行残差矢量量化处理,输出待处理音频的残差矢量量化特征向量;将残差矢量量化特征向量输入至解码器网络层之中,对残差矢量量化特征向量进行解码处理,输出重建后的待处理音频。结合声码器监督分支的语音处理模型可以把音频信号编码为离散的表示,在声码器的辅助监督下提高重建的音频质量,保证模型性能不降低的情况下提高处理速度。
技术关键词
矢量量化 声码器 神经网络模型 量化器 样本 解码器 语音 编码器 波形 机器可读指令 模型训练模块 音频信号编码 电子设备 处理器 可读存储介质 分支 存储器
系统为您推荐了相关专利信息
1
基于图卷积网络的匿名说话人攻击方法
特征提取器 矢量量化 网络 说话人身份信息 语言转换技术
2
一种用于疏水阀的检漏方法及系统
疏水阀 检漏方法 传感器阵列 基准 参数
3
一种作业车辆的导航方法、装置、电子设备及介质
作业车辆 图像 锚点 导航方法 坐标
4
基于低算力设备的教学行为智能识别方法和系统
智能识别系统 教学 神经网络模型 数据采集模块 智能识别方法
5
一种太赫兹超材料增强型光谱检测系统
太赫兹超材料 光谱检测系统 拓扑网络 因子 谐振
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号