一种基于异构空间融合和双维度注意力的语音增强方法

AITNT
正文
推荐专利
一种基于异构空间融合和双维度注意力的语音增强方法
申请号:CN202410801437
申请日期:2024-06-20
公开号:CN118841020A
公开日期:2024-10-25
类型:发明专利
摘要
本发明公开了一种基于异构空间融合和双维度注意力的语音增强方法,主要涉及语音信号处理的语音增强技术领域;包括步骤:S1、输入端采用两个不同空间特征的分支进行馈送,其中,一个分支首先通过STFT将语音波形数据转化为语谱图,然后使用ODConv模块从语谱图中提取关键信息;另一个分支将语音数据输入到自监督模型中,提取高层语义信息;S2、通过级联操作将两个分支输出的特征在时间维度上进行融合,然后将其输入到DDA模块中;S3、通过前馈层对数据进行处理后输出;本发明能实现跨越各个维度的关键信息的整合与提取,对conformer模型进行强化,增强其不仅在时间维度上的特征提取能力,而且在频率维度上的特征提取能力。
技术关键词
注意力 高层语义信息 特征提取能力 分支 异构 语音信号处理 模块 元素 数据 级联 输入端 波形 频率 矩阵 通道
系统为您推荐了相关专利信息
1
异构代码转译方法、装置、设备及介质
异构 转译方法 内存访问指令 计算机程序指令 嵌入式硬件系统
2
一种智能网联汽车上基于单目摄像头的距离检测方法、设备和存储介质
单目摄像头 距离检测方法 卷积编码器 稀疏深度图 智能网联汽车
3
基于Hawkes过程与TimeXer机制的动态偏好感知在线课程推荐方法
在线课程推荐方法 注意力机制 球面 动态 强度
4
基于知识图谱的微服务系统内的在线服务推荐方法
在线服务推荐方法 情境感知服务 锚点 服务系统 节点
5
基于大语言模型的虚拟糖尿病标准化病人问诊系统及方法
标准化病人 大语言模型 问诊系统 数据存取模块 问诊方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号