摘要
本发明公开了一种面向手术室语音交互的多模态特征融合的噪声抑制方法,其中语音噪声分离模型的建立方法包括:获取语音样本数据、噪声样本数据及对应的噪声特性数据;将所述语音样本数据和噪声样本数据按照预设比例混合形成混合语音样本数据;对所述混合语音样本数据、所述噪声特性数据分别进行特征提取,得到混合音频特征和噪声特征;对所述混合音频特征和所述噪声特性特征进行融合,得到融合特征;将融合特征进行自注意力机制计算,输出特征矩阵;将所述特征矩阵作为输入,以语音数据和噪声数据的分离特征作为输出,对动态域自适应神经网络中进行训练,得到语音噪声分离模型。
技术关键词
语音噪声
噪声样本
噪声抑制方法
融合特征
音频特征
噪声特征
噪声数据
手术室
内窥镜系统
注意力机制
图像采集装置
输出特征
多模态特征融合
处理器
系统为您推荐了相关专利信息
睡眠监测信号
信号特征
睡眠阶段分类方法
融合特征
序列
智能喷洒系统
病虫害
环境感知数据
林业
喷洒控制模块