摘要
本申请公开了一种音频处理方法、装置、非易失性存储介质及电子设备。其中,该方法包括:确定目标发声对象的第一声音特征,以及待处理音频的第一语义信息,其中,待处理音频为目标发声对象发出的音频;确定待处理音频的待处理音频特征图,其中,待处理音频特征图用于体现待处理音频的音频特征;拼接第一声音特征,第一语义信息和音频特征图,得到第一拼接结果;采用音频处理模型处理第一拼接结果,得到与待处理音频对应的目标音频,其中,音频处理模型包括扩散模型。本申请解决了由于相关技术中采用人工调节的方式对音频进行美化处理导致的成本高且效率低的技术问题。
技术关键词
音频特征
非易失性存储介质
语义
发声
随机噪声
掩膜
数据
噪声特征
对象
电子设备
计算机程序产品
处理器
模块
存储器
矩阵
时间段
系统为您推荐了相关专利信息
代码混淆方法
代码混淆装置
神经网络模型训练
结构特征提取
识别模型训练
音频特征
视频生成方法
图像
计算机程序指令
语义特征提取
控系统网络
恶意流量检测方法
正则化极限学习机
恶意流量检测模型
粒子群算法优化
光谱图像分类方法
半监督学习模型
线性
高光谱遥感图像
编码器模块
急诊监护室
语义协同
识别方法
视频流
3DCNN模型