面向手术室语音交互的多模态特征融合的噪声抑制方法

正文

推荐专利

申请号：CN202510688876

申请日期：2025-05-27

公开号：CN120748421A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种面向手术室语音交互的多模态特征融合的噪声抑制方法，其中语音噪声分离模型的建立方法包括：获取语音样本数据、噪声样本数据及对应的噪声特性数据；将所述语音样本数据和噪声样本数据按照预设比例混合形成混合语音样本数据；对所述混合语音样本数据、所述噪声特性数据分别进行特征提取，得到混合音频特征和噪声特征；对所述混合音频特征和所述噪声特性特征进行融合，得到融合特征；将融合特征进行自注意力机制计算，输出特征矩阵；将所述特征矩阵作为输入，以语音数据和噪声数据的分离特征作为输出，对动态域自适应神经网络中进行训练，得到语音噪声分离模型。

技术关键词

语音噪声噪声样本噪声抑制方法融合特征音频特征噪声特征噪声数据手术室内窥镜系统注意力机制图像采集装置输出特征多模态特征融合处理器

系统为您推荐了相关专利信息

一种基于事件相机的去除图像反射耀斑系统与方法

事件流数据处理单元事件特征图像事件相机

基于脑电数据的情绪识别结果可视化方法和系统

令牌可视化方法频域特征注意力空域特征

睡眠阶段分类方法、装置、计算机设备和可读存储介质

睡眠监测信号信号特征睡眠阶段分类方法融合特征序列

基于多源传感器空间感知的林业智能喷洒系统及喷洒方法

智能喷洒系统病虫害环境感知数据林业喷洒控制模块

服务推荐方法、装置、电子设备及计算机程序产品

融合特征情景服务推荐方法情感反馈画像模型

面向手术室语音交互的多模态特征融合的噪声抑制方法

站点导航

APP 下载