面向手术室语音交互的多模态特征融合的噪声抑制方法

AITNT
正文
推荐专利
面向手术室语音交互的多模态特征融合的噪声抑制方法
申请号:CN202510688876
申请日期:2025-05-27
公开号:CN120748421A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种面向手术室语音交互的多模态特征融合的噪声抑制方法,其中语音噪声分离模型的建立方法包括:获取语音样本数据、噪声样本数据及对应的噪声特性数据;将所述语音样本数据和噪声样本数据按照预设比例混合形成混合语音样本数据;对所述混合语音样本数据、所述噪声特性数据分别进行特征提取,得到混合音频特征和噪声特征;对所述混合音频特征和所述噪声特性特征进行融合,得到融合特征;将融合特征进行自注意力机制计算,输出特征矩阵;将所述特征矩阵作为输入,以语音数据和噪声数据的分离特征作为输出,对动态域自适应神经网络中进行训练,得到语音噪声分离模型。
技术关键词
语音噪声 噪声样本 噪声抑制方法 融合特征 音频特征 噪声特征 噪声数据 手术室 内窥镜系统 注意力机制 图像采集装置 输出特征 多模态特征融合 处理器
系统为您推荐了相关专利信息
1
一种基于事件相机的去除图像反射耀斑系统与方法
事件流 数据处理单元 事件特征 图像 事件相机
2
基于脑电数据的情绪识别结果可视化方法和系统
令牌 可视化方法 频域特征 注意力 空域特征
3
睡眠阶段分类方法、装置、计算机设备和可读存储介质
睡眠监测信号 信号特征 睡眠阶段分类方法 融合特征 序列
4
基于多源传感器空间感知的林业智能喷洒系统及喷洒方法
智能喷洒系统 病虫害 环境感知数据 林业 喷洒控制模块
5
服务推荐方法、装置、电子设备及计算机程序产品
融合特征 情景 服务推荐方法 情感反馈 画像模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号