一种低延时蓝牙耳机的多模态人声增强方法

正文

推荐专利

一种低延时蓝牙耳机的多模态人声增强方法

申请号：CN202510815233

申请日期：2025-06-18

公开号：CN120980392A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及多模态人声增强方法技术领域，具体涉及一种低延时蓝牙耳机的多模态人声增强方法,该方法包括如下步骤：S1：麦克风采集用户说话时耳机的骨传导信号，同时录制环境声音和用户语音；S2：数据预处理；S3：基于端到端的深度学习模块；S4：基于信号分离模块；S5：深度学习与信号分离模块融合；采用先降噪后滤波的思路，噪声成分在信号分离算法中提取后，输入信号减去信号分离中的噪声成分及上一步深度学习模块增强的人声部分，即为最后的人声信号，用于恢复目标信号并抑制背景环境噪声,通过多模态信号融合，提高了系统对目标语音的捕捉能力，有效降低了环境噪声的干扰。在提升语音增强效果的同时，实现了低延迟处理。

技术关键词

人声蓝牙耳机噪声编码器深度学习模型解码器模型优化方法语音注意力机制骨传导麦克风信号滤波模块误差函数信号特征提取

系统为您推荐了相关专利信息

基于三维重建技术的双摄网络摄像机连续变焦方法

三维重建技术变焦方法图像深度图三维模型模拟

一种样本稀缺条件下轴向柱塞泵故障诊断方法

轴向柱塞泵故障诊断方法样本结构特征提取特征提取器

一种电磁仿真网格密度预测方法及其系统

深度学习模型射频集成电路电磁仿真密度预测方法网格

基于MWORKS软件的无人机影像数据实时处理方法及系统

特征匹配算法 RANSAC算法多光谱传感器 5G无线通信 Delaunay三角网

一种用于树木冠层的光抑制效应分析方法及系统

冠层结构树木冠层分布特征分析方法三维点云数据

一种低延时蓝牙耳机的多模态人声增强方法

站点导航

APP 下载