一种结合领域注意力与多模态调制的复杂声源分离方法

正文

推荐专利

申请号：CN202510607295

申请日期：2025-05-13

公开号：CN120412623A

公开日期：2025-08-01

类型：发明专利

摘要

本发明涉及声学信号处理领域，公开了一种结合领域注意力与多模态调制的复杂声源分离方法，包括：获取声源分离数据集；构建基于改进ResUNet架构的声源分离网络模型；采用所述声源分离数据集训练所述声源分离网络模型，得到训练好的模型；利用训练好的模型完成复杂声源分离。本发明有益效果是：本发明实现了对多源复杂声学信号的精细化建模与高效分离，在保证实时性的同时提升语义引导精度，为智能城市噪声治理、语音交互系统优化及工业声学监测提供了创新性解决方案，推动音频处理技术向动态化、智能化方向演进。

技术关键词

音频特征解码器编码器声学信号处理残差模块邻域注意力机制噪声治理语义向量网络动态输出特征数据输入模块多模态上采样多尺度

系统为您推荐了相关专利信息

一种农用无人机的农田边界自动识别方法

农田边界农用无人机自动识别方法数字地表模型通道注意力机制

基于自监督学习的复杂天气场景图像单目深度估计方法

单目深度估计方法深度图图像分支天气

体型参数可控的风格化人体动画生成方法、装置及设备

人体动画生成方法语义标签音频特征体型关节点

声学模型的生成方法、装置、电子设备及存储介质

声学处理单元声学特征标签韵律特征文本

一种适用于大惯量转台的快速稳定调转方法

速度反馈环路 ADRC算法算法模块角度传感器 PI算法

一种结合领域注意力与多模态调制的复杂声源分离方法

站点导航

APP 下载