一种基于深度学习的多模态语音通信抗噪方法

正文

推荐专利

申请号：CN202511233858

申请日期：2025-09-01

公开号：CN121011159A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于深度学习的多模态语音通信抗噪方法，属于语音通信技术领域，包括：采集语音通信多模态数据，对语音通信多模态数据进行预处理，提取特征进行融合，形成语音通信多模态融合数据；构建多模态语音通信抗噪增强模型对语音通信多模态融合数据进行分析，自动识别噪声和语音特征，对噪声进行抑制且对语音进行增强，确定多模态语音通信抗噪处理后的用户通信增强语音，并对用户通信增强语音进行输出。本发明解决了现有的不能基于深度学习且结合多模态融合对语音通信进行抗噪，导致语音识别准确性低，降低了语音通信的清晰度和准确性的问题。本发明可对语音通信进行有效抗噪，提升语音识别准确性，且提高语音通信的清晰度和准确性。

技术关键词

多模态语音抗噪方法语音特征通信历史数据语音识别准确性噪声抑制信噪比后处理模块深度学习模型语音通信技术音频特征视觉特征注意力机制网络层结构残留噪声

系统为您推荐了相关专利信息

一种语音识别方法、装置、设备及可读存储介质

语音特征语音识别方法局部特征信息语音识别模型梅尔频率倒谱系数

基于语音与表情特征多模态融合的AD筛查方法

表情特征筛查方法多模态人脸表情图像语音特征

一种基于深度学习的协同语音手势生成方法及系统

手势生成方法姿态特征长短期记忆网络多模态特征序列

语音解耦方法、装置、电子设备及计算机可读存储介质

解耦方法声学特征编码向量递归网络模型语义

一种讲话视频合成方法和系统

语音特征情绪特征视频序列身份

一种基于深度学习的多模态语音通信抗噪方法

站点导航

APP 下载