一种低延时蓝牙耳机的多模态人声增强方法

AITNT
正文
推荐专利
一种低延时蓝牙耳机的多模态人声增强方法
申请号:CN202510815233
申请日期:2025-06-18
公开号:CN120980392A
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及多模态人声增强方法技术领域,具体涉及一种低延时蓝牙耳机的多模态人声增强方法,该方法包括如下步骤:S1:麦克风采集用户说话时耳机的骨传导信号,同时录制环境声音和用户语音;S2:数据预处理;S3:基于端到端的深度学习模块;S4:基于信号分离模块;S5:深度学习与信号分离模块融合;采用先降噪后滤波的思路,噪声成分在信号分离算法中提取后,输入信号减去信号分离中的噪声成分及上一步深度学习模块增强的人声部分,即为最后的人声信号,用于恢复目标信号并抑制背景环境噪声,通过多模态信号融合,提高了系统对目标语音的捕捉能力,有效降低了环境噪声的干扰。在提升语音增强效果的同时,实现了低延迟处理。
技术关键词
人声 蓝牙耳机 噪声 编码器 深度学习模型 解码器 模型优化方法 语音 注意力机制 骨传导麦克风 信号滤波模块 误差函数 信号特征提取
系统为您推荐了相关专利信息
1
基于三维重建技术的双摄网络摄像机连续变焦方法
三维重建技术 变焦方法 图像 深度图 三维模型模拟
2
一种样本稀缺条件下轴向柱塞泵故障诊断方法
轴向柱塞泵 故障诊断方法 样本 结构特征提取 特征提取器
3
一种电磁仿真网格密度预测方法及其系统
深度学习模型 射频集成电路 电磁仿真 密度预测方法 网格
4
基于MWORKS软件的无人机影像数据实时处理方法及系统
特征匹配算法 RANSAC算法 多光谱传感器 5G无线通信 Delaunay三角网
5
一种用于树木冠层的光抑制效应分析方法及系统
冠层结构 树木冠层 分布特征 分析方法 三维点云数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号