摘要
本发明涉及音频处理技术领域,尤其涉及一种基于人工智能的音频优化方法、装置、计算机设备及介质。该方法使用线性层对待优化音频的频谱包络映射得到包络特征,使用嵌入层将标准音频参数嵌入为参数特征,使用预测模型对包络特征和参数特征的融合特征预测,得到预测音高曲线,使用加噪模型对待优化音频的梅尔频谱加噪,得到加噪结果,使用噪声估计模型计算加噪结果的噪声,得到预测噪声,根据预测噪声、真实噪声和预测音高曲线,更新噪声估计模型,使用更新好的噪声估计模型计算加噪结果的参考噪声,根据参考噪声对加噪结果去噪,得到优化后的梅尔频谱,结合音高信息优化噪声估计模型,使得去噪过程满足音高需求,提高了音频优化的效果。
技术关键词
音频优化方法
包络
融合特征
参数
样本
计算机设备
数据
曲线
优化装置
线性
优化噪声
生成随机数
可读存储介质
噪声预测
特征提取模块
处理器
模型更新
系统为您推荐了相关专利信息
集成电路金属
寄生电容模型
表达式
建模方法
关系
风险评估系统
多模态
数据特征提取
分类器
跨模态
机器人控制系统
深度相机
机器人行进路径
机器人控制方法
风险
油色谱数据
数据修正装置
数据修正方法
移动平均算法
卡尔曼滤波算法