摘要
本申请实施例公开了一种音频处理方法、模型训练方法及装置、设备、存储介质、产品。音频处理方法包括:在本申请实施例中,获取待配乐的动作视频所对应的节奏条件向量和动作视频的参考和弦,基于节奏条件向量,对噪声数据进行节拍维度的降噪处理,得到动作视频的预测节拍,基于节奏条件向量和参考和弦,对噪声数据进行和弦维度的降噪处理,得到动作视频的预测和弦,对预测节拍和预测和弦进行融合,得到动作视频的配乐。可见,通过不同的约束条件分别对配乐的节拍及和弦进行降噪处理,可以解耦配乐的预测过程,使得节拍及和弦的预测过程更具针对性,进而提高动作视频的配乐的质量。
技术关键词
深度学习网络
噪声数据
视频
模型训练方法
注意力
噪声分量
音频
样本
模型训练装置
深度网络学习
计算机程序产品
对象
风格
视觉特征提取
处理器
可读存储介质
处理单元
计算机设备