摘要
本发明公开了一种基于深度学习的多模态语音通信抗噪方法,属于语音通信技术领域,包括:采集语音通信多模态数据,对语音通信多模态数据进行预处理,提取特征进行融合,形成语音通信多模态融合数据;构建多模态语音通信抗噪增强模型对语音通信多模态融合数据进行分析,自动识别噪声和语音特征,对噪声进行抑制且对语音进行增强,确定多模态语音通信抗噪处理后的用户通信增强语音,并对用户通信增强语音进行输出。本发明解决了现有的不能基于深度学习且结合多模态融合对语音通信进行抗噪,导致语音识别准确性低,降低了语音通信的清晰度和准确性的问题。本发明可对语音通信进行有效抗噪,提升语音识别准确性,且提高语音通信的清晰度和准确性。
技术关键词
多模态语音
抗噪方法
语音特征
通信历史数据
语音识别准确性
噪声抑制
信噪比
后处理模块
深度学习模型
语音通信技术
音频特征
视觉特征
注意力机制
网络层结构
残留噪声
系统为您推荐了相关专利信息
语音特征
语音识别方法
局部特征信息
语音识别模型
梅尔频率倒谱系数
表情特征
筛查方法
多模态
人脸表情图像
语音特征
手势生成方法
姿态特征
长短期记忆网络
多模态特征
序列