一种结合领域注意力与多模态调制的复杂声源分离方法

AITNT
正文
推荐专利
一种结合领域注意力与多模态调制的复杂声源分离方法
申请号:CN202510607295
申请日期:2025-05-13
公开号:CN120412623A
公开日期:2025-08-01
类型:发明专利
摘要
本发明涉及声学信号处理领域,公开了一种结合领域注意力与多模态调制的复杂声源分离方法,包括:获取声源分离数据集;构建基于改进ResUNet架构的声源分离网络模型;采用所述声源分离数据集训练所述声源分离网络模型,得到训练好的模型;利用训练好的模型完成复杂声源分离。本发明有益效果是:本发明实现了对多源复杂声学信号的精细化建模与高效分离,在保证实时性的同时提升语义引导精度,为智能城市噪声治理、语音交互系统优化及工业声学监测提供了创新性解决方案,推动音频处理技术向动态化、智能化方向演进。
技术关键词
音频特征 解码器 编码器 声学信号处理 残差模块 邻域 注意力机制 噪声治理 语义向量 网络 动态 输出特征 数据 输入模块 多模态 上采样 多尺度
系统为您推荐了相关专利信息
1
一种农用无人机的农田边界自动识别方法
农田边界 农用无人机 自动识别方法 数字地表模型 通道注意力机制
2
基于自监督学习的复杂天气场景图像单目深度估计方法
单目深度估计方法 深度图 图像 分支 天气
3
体型参数可控的风格化人体动画生成方法、装置及设备
人体动画生成方法 语义标签 音频特征 体型 关节点
4
声学模型的生成方法、装置、电子设备及存储介质
声学处理单元 声学特征 标签 韵律特征 文本
5
一种适用于大惯量转台的快速稳定调转方法
速度反馈环路 ADRC算法 算法模块 角度传感器 PI算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号