摘要
本发明涉及多模态人声增强方法技术领域,具体涉及一种低延时蓝牙耳机的多模态人声增强方法,该方法包括如下步骤:S1:麦克风采集用户说话时耳机的骨传导信号,同时录制环境声音和用户语音;S2:数据预处理;S3:基于端到端的深度学习模块;S4:基于信号分离模块;S5:深度学习与信号分离模块融合;采用先降噪后滤波的思路,噪声成分在信号分离算法中提取后,输入信号减去信号分离中的噪声成分及上一步深度学习模块增强的人声部分,即为最后的人声信号,用于恢复目标信号并抑制背景环境噪声,通过多模态信号融合,提高了系统对目标语音的捕捉能力,有效降低了环境噪声的干扰。在提升语音增强效果的同时,实现了低延迟处理。
技术关键词
人声
蓝牙耳机
噪声
编码器
深度学习模型
解码器
模型优化方法
语音
注意力机制
骨传导麦克风
信号滤波模块
误差函数
信号特征提取
系统为您推荐了相关专利信息
三维重建技术
变焦方法
图像
深度图
三维模型模拟
轴向柱塞泵
故障诊断方法
样本
结构特征提取
特征提取器
深度学习模型
射频集成电路
电磁仿真
密度预测方法
网格
特征匹配算法
RANSAC算法
多光谱传感器
5G无线通信
Delaunay三角网
冠层结构
树木冠层
分布特征
分析方法
三维点云数据