基于自监督嵌入的跨域特征融合及多注意力的语音增强方法

正文

推荐专利

申请号：CN202410982266

申请日期：2024-07-22

公开号：CN118737171A

公开日期：2024-10-01

类型：发明专利

摘要

本发明公开了基于自监督嵌入的跨域特征融合及多注意力的语音增强方法，主要涉及语音增强技术领域；包括步骤：S1、纯净语音和带噪语音进行初步的数字信号处理，得到语谱图和相位谱；S2、构建基于自监督嵌入的跨域特征融合及多注意力的语音增强架构；S3、通过语音样本数据集对架构进行训练，获得基于自监督嵌入的跨域特征融合及多注意力的语音增强模型；S4、将带噪语音输入模型，即可获得增强后的语谱图，利用增强后的语谱图和原始带噪语音的相位来重构增强后的语音时域信号；本发明能够进一步提高语音高层语义信息和细粒度信息的高效融合，实现模型能提取语音特征在通道上的上下文依赖关系和时间上的上下文依赖关系和局部细节信息。

技术关键词

注意力监督学习模型融合特征网络模块数字信号处理通道高层语义信息分支多尺度语音特征语谱图重构样本关系参数数据

系统为您推荐了相关专利信息

一种基于跨模态特征对齐的细粒度零样本医学图像分类方法

医学图像分类方法注意力模型数字病理图像预测类别图像块特征

一种基于改进YOLOv8的苹果叶片病害检测方法

病害检测方法叶片病虫害图像图像处理方法图像空间信息

基于叠加扩散模型的推理网络仿真流量生成方法和装置

流量生成方法样本视频推理网络文本

数据处理方法及装置、电子设备、计算机可读存储介质

循环神经网络模型数据处理模型键值注意力数据处理方法

一种基于图卷积神经网络模型下智慧就医系统

卷积神经网络模型卷积神经网络模块关系实体患者

基于自监督嵌入的跨域特征融合及多注意力的语音增强方法

站点导航

APP 下载