摘要
本申请公开了一种音频处理方法、装置、非易失性存储介质及电子设备。其中,该方法包括:确定目标发声对象的第一声音特征,以及待处理音频的第一语义信息,其中,待处理音频为目标发声对象发出的音频;确定待处理音频的待处理音频特征图,其中,待处理音频特征图用于体现待处理音频的音频特征;拼接第一声音特征,第一语义信息和音频特征图,得到第一拼接结果;采用音频处理模型处理第一拼接结果,得到与待处理音频对应的目标音频,其中,音频处理模型包括扩散模型。本申请解决了由于相关技术中采用人工调节的方式对音频进行美化处理导致的成本高且效率低的技术问题。
技术关键词
音频特征
非易失性存储介质
语义
发声
随机噪声
掩膜
数据
噪声特征
对象
电子设备
计算机程序产品
处理器
模块
存储器
矩阵
时间段
系统为您推荐了相关专利信息
企业画像生成方法
企业知识库
校验规则
语义
基础
语音意图识别
融合语义
分类系统
文本
语音采集模块