摘要
本发明涉及语音语义技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种音频超分辨率生成方法、装置、设备及介质,所述方法包括:获取原始音频,对所述原始音频进行音频增强处理,得到待处理音频,并对所述待处理音频进行音频分帧,得到频谱特征序列;对所述频谱特征序列进行音频特征编码,得到低分辨率音频特征序列;对所述低分辨率音频特征序列进行扩散蒸馏处理,得到优化低维音频特征序列;对所述优化低维音频特征序列进行反卷积解码处理,得到目标高维音频特征序列;根据所述目标高维音频特征序列生成所述待处理音频的目标超分辨率音频。本发明可以提升低分辨率音频质量以及处理效率。
技术关键词
音频特征
超分辨率
序列
频谱特征
生成方法
融合特征
语音语义技术
压缩特征
多维度特征提取
加权特征
多层特征融合
时域特征
蒸馏
频域特征
短时傅里叶变换
无干扰
解码
注意力
处理器