一种基于异构空间融合和双维度注意力的语音增强方法

正文

推荐专利

申请号：CN202410801437

申请日期：2024-06-20

公开号：CN118841020A

公开日期：2024-10-25

类型：发明专利

摘要

本发明公开了一种基于异构空间融合和双维度注意力的语音增强方法，主要涉及语音信号处理的语音增强技术领域；包括步骤：S1、输入端采用两个不同空间特征的分支进行馈送，其中，一个分支首先通过STFT将语音波形数据转化为语谱图，然后使用ODConv模块从语谱图中提取关键信息；另一个分支将语音数据输入到自监督模型中，提取高层语义信息；S2、通过级联操作将两个分支输出的特征在时间维度上进行融合，然后将其输入到DDA模块中；S3、通过前馈层对数据进行处理后输出；本发明能实现跨越各个维度的关键信息的整合与提取，对conformer模型进行强化，增强其不仅在时间维度上的特征提取能力，而且在频率维度上的特征提取能力。

技术关键词

注意力高层语义信息特征提取能力分支异构语音信号处理模块元素数据级联输入端波形频率矩阵通道

系统为您推荐了相关专利信息

异构代码转译方法、装置、设备及介质

异构转译方法内存访问指令计算机程序指令嵌入式硬件系统

一种智能网联汽车上基于单目摄像头的距离检测方法、设备和存储介质

单目摄像头距离检测方法卷积编码器稀疏深度图智能网联汽车

基于Hawkes过程与TimeXer机制的动态偏好感知在线课程推荐方法

在线课程推荐方法注意力机制球面动态强度

基于知识图谱的微服务系统内的在线服务推荐方法

在线服务推荐方法情境感知服务锚点服务系统节点

基于大语言模型的虚拟糖尿病标准化病人问诊系统及方法

标准化病人大语言模型问诊系统数据存取模块问诊方法

一种基于异构空间融合和双维度注意力的语音增强方法

站点导航

APP 下载