基于自监督嵌入的跨域特征融合及多注意力的语音增强方法

AITNT
正文
推荐专利
基于自监督嵌入的跨域特征融合及多注意力的语音增强方法
申请号:CN202410982266
申请日期:2024-07-22
公开号:CN118737171A
公开日期:2024-10-01
类型:发明专利
摘要
本发明公开了基于自监督嵌入的跨域特征融合及多注意力的语音增强方法,主要涉及语音增强技术领域;包括步骤:S1、纯净语音和带噪语音进行初步的数字信号处理,得到语谱图和相位谱;S2、构建基于自监督嵌入的跨域特征融合及多注意力的语音增强架构;S3、通过语音样本数据集对架构进行训练,获得基于自监督嵌入的跨域特征融合及多注意力的语音增强模型;S4、将带噪语音输入模型,即可获得增强后的语谱图,利用增强后的语谱图和原始带噪语音的相位来重构增强后的语音时域信号;本发明能够进一步提高语音高层语义信息和细粒度信息的高效融合,实现模型能提取语音特征在通道上的上下文依赖关系和时间上的上下文依赖关系和局部细节信息。
技术关键词
注意力 监督学习模型 融合特征 网络模块 数字信号处理 通道 高层语义信息 分支 多尺度 语音特征 语谱图 重构 样本 关系 参数 数据
系统为您推荐了相关专利信息
1
一种基于跨模态特征对齐的细粒度零样本医学图像分类方法
医学图像分类方法 注意力模型 数字病理图像 预测类别 图像块特征
2
一种基于改进YOLOv8的苹果叶片病害检测方法
病害检测方法 叶片 病虫害图像 图像处理方法 图像空间信息
3
基于叠加扩散模型的推理网络仿真流量生成方法和装置
流量生成方法 样本 视频 推理网络 文本
4
数据处理方法及装置、电子设备、计算机可读存储介质
循环神经网络模型 数据处理模型 键值 注意力 数据处理方法
5
一种基于图卷积神经网络模型下智慧就医系统
卷积神经网络模型 卷积神经网络模块 关系 实体 患者
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号