摘要
本发明公开了一种基于异构空间融合和双维度注意力的语音增强方法,主要涉及语音信号处理的语音增强技术领域;包括步骤:S1、输入端采用两个不同空间特征的分支进行馈送,其中,一个分支首先通过STFT将语音波形数据转化为语谱图,然后使用ODConv模块从语谱图中提取关键信息;另一个分支将语音数据输入到自监督模型中,提取高层语义信息;S2、通过级联操作将两个分支输出的特征在时间维度上进行融合,然后将其输入到DDA模块中;S3、通过前馈层对数据进行处理后输出;本发明能实现跨越各个维度的关键信息的整合与提取,对conformer模型进行强化,增强其不仅在时间维度上的特征提取能力,而且在频率维度上的特征提取能力。
技术关键词
注意力
高层语义信息
特征提取能力
分支
异构
语音信号处理
模块
元素
数据
级联
输入端
波形
频率
矩阵
通道
系统为您推荐了相关专利信息
异构
转译方法
内存访问指令
计算机程序指令
嵌入式硬件系统
单目摄像头
距离检测方法
卷积编码器
稀疏深度图
智能网联汽车
在线服务推荐方法
情境感知服务
锚点
服务系统
节点
标准化病人
大语言模型
问诊系统
数据存取模块
问诊方法