摘要
本申请实施例属于音频处理技术领域,涉及高效音频数据生成方法、装置、计算机设备及存储介质,该方法包括:获取用户终端发送的MEL频谱信息;将所述MEL频谱信息输入至第一ConvNeXt组件,得到第一变量数据;对所述MEL频谱信息以及所述第一变量数据进行特征融合操作,得到特征融合数据;将所述特征融合数据输入至第二ConvNeXt组件,得到第二变量数据;对所述第二变量数据进行逆快速傅里叶变换操作,得到目标音频数据。本申请不仅达到了与最先进的音频质量相匹配,而且显著提高了计算效率,与当前流行的时域神经声码器方法相比,速度提高了整整一个数量级。
技术关键词
音频数据生成方法
变量
计算机可读指令
时域平滑技术
计算机设备
卷积神经网络提取
噪声抑制技术
分段
心理声学模型
数据生成装置
约束技术
可读存储介质
信号
注意力
终端
声码器
处理器
模块
系统为您推荐了相关专利信息
预测模型构建方法
机器学习算法
异构业务
生成数据集
模型构建装置
优化运行方法
平台
负荷需求响应
电能
新能源设备
代谢组学数据
植物组织培养环境
变量
分析模型参数
采集环境参数
时序预测模型
变量
序列
注意力机制
神经网络单元