一种基于多头注意力机制和Bi-LSTM的复数去混响语音增强方法

AITNT
正文
推荐专利
一种基于多头注意力机制和Bi-LSTM的复数去混响语音增强方法
申请号:CN202410954745
申请日期:2024-07-17
公开号:CN119107963A
公开日期:2024-12-10
类型:发明专利
摘要
本发明公开了一种基于多头注意力机制和Bi‑LSTM的复数去混响语音增强方法,属于语音增强技术领域。本发明在复数域进行去混响处理,首先将信号进行STFT变换得到复数谱,以充分地利用幅度和相位信息。然后将复数谱特征送入高级通道注意力机制HCA以融合特征。其次,为了能够捕捉输入序列内部不同位置之间的相关性并利用时间和频率信息捕捉语音关键成分,设计了一种时频双路径复多头注意力机制TF‑CMHA,更准确地识别语音成分并抑制混响成分。最后,引入了复乘法运算和联合约束损失函数,模拟幅值和相位之间的相关关系,获得更为精确的长时语音相关性的描述。本发明实现了对去混响语音增强系统性能的提升,使系统去混响后的语音在各种测量指标上均有提升,适用于语音前端处理。
技术关键词
多头注意力机制 池化特征 输出特征 语音 通道注意力机制 混响成分 信号 联合损失函数 卷积滤波器 有效性 元素 融合特征 频率 关系 矩阵 定义 算法 序列
系统为您推荐了相关专利信息
1
一种深度神经网络投毒攻击方法
耦合特征 深度神经网络 通道注意力机制 输出特征 图像拼接
2
语音识别设备
语音识别设备 功放模块 声音采集模块 电容 信号
3
一种基于BiSight-Net的恶劣天气双焦点车辆检测方法
车辆检测方法 输出特征 双焦点 模块 分支
4
一种基于AR技术和实景漫游的景点导览系统与方法
景点导览系统 导航模块 自定义地图 智能路线规划 导游
5
一种基于AI大模型的保险条款解析系统
解析系统 输入模块 处理器 显示设备 客户端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号