一种基于深度学习的多模态语音通信抗噪方法

AITNT
正文
推荐专利
一种基于深度学习的多模态语音通信抗噪方法
申请号:CN202511233858
申请日期:2025-09-01
公开号:CN121011159A
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了一种基于深度学习的多模态语音通信抗噪方法,属于语音通信技术领域,包括:采集语音通信多模态数据,对语音通信多模态数据进行预处理,提取特征进行融合,形成语音通信多模态融合数据;构建多模态语音通信抗噪增强模型对语音通信多模态融合数据进行分析,自动识别噪声和语音特征,对噪声进行抑制且对语音进行增强,确定多模态语音通信抗噪处理后的用户通信增强语音,并对用户通信增强语音进行输出。本发明解决了现有的不能基于深度学习且结合多模态融合对语音通信进行抗噪,导致语音识别准确性低,降低了语音通信的清晰度和准确性的问题。本发明可对语音通信进行有效抗噪,提升语音识别准确性,且提高语音通信的清晰度和准确性。
技术关键词
多模态语音 抗噪方法 语音特征 通信历史数据 语音识别准确性 噪声抑制 信噪比 后处理模块 深度学习模型 语音通信技术 音频特征 视觉特征 注意力机制 网络层结构 残留噪声
系统为您推荐了相关专利信息
1
一种语音识别方法、装置、设备及可读存储介质
语音特征 语音识别方法 局部特征信息 语音识别模型 梅尔频率倒谱系数
2
基于语音与表情特征多模态融合的AD筛查方法
表情特征 筛查方法 多模态 人脸表情图像 语音特征
3
一种基于深度学习的协同语音手势生成方法及系统
手势生成方法 姿态特征 长短期记忆网络 多模态特征 序列
4
语音解耦方法、装置、电子设备及计算机可读存储介质
解耦方法 声学特征 编码向量 递归网络模型 语义
5
一种讲话视频合成方法和系统
语音特征 情绪特征 视频 序列 身份
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号