摘要
本发明公开了基于自监督嵌入的跨域特征融合及多注意力的语音增强方法,主要涉及语音增强技术领域;包括步骤:S1、纯净语音和带噪语音进行初步的数字信号处理,得到语谱图和相位谱;S2、构建基于自监督嵌入的跨域特征融合及多注意力的语音增强架构;S3、通过语音样本数据集对架构进行训练,获得基于自监督嵌入的跨域特征融合及多注意力的语音增强模型;S4、将带噪语音输入模型,即可获得增强后的语谱图,利用增强后的语谱图和原始带噪语音的相位来重构增强后的语音时域信号;本发明能够进一步提高语音高层语义信息和细粒度信息的高效融合,实现模型能提取语音特征在通道上的上下文依赖关系和时间上的上下文依赖关系和局部细节信息。
技术关键词
注意力
监督学习模型
融合特征
网络模块
数字信号处理
通道
高层语义信息
分支
多尺度
语音特征
语谱图
重构
样本
关系
参数
数据
系统为您推荐了相关专利信息
医学图像分类方法
注意力模型
数字病理图像
预测类别
图像块特征
病害检测方法
叶片
病虫害图像
图像处理方法
图像空间信息
循环神经网络模型
数据处理模型
键值
注意力
数据处理方法
卷积神经网络模型
卷积神经网络模块
关系
实体
患者