摘要
本申请涉及声源定位技术领域,提供多声源的融合定位方法、装置、设备、存储介质和产品,该方法包括:采用第一声源定位算法对声音数据进行峰值检测,得到第一峰值结果;在包括至少两个峰值的情况下,确定至少两个峰值中的最大能量声源作为初步主声源;检测第二峰值结果和第三峰值结果中是否存在峰值落入第一角度范围,以得到第一检测结果;第一角度范围是根据初步主声源的角度位置确定的;第二峰值结果是采用第二声源定位算法对声音数据进行峰值检测得到的;第三峰值结果是采用第三声源定位算法对声音数据进行峰值检测得到的;根据第一检测结果确定主声源的定位结果。本申请可以在多声源混响的情况下,实现良好的定位效果,提升整体鲁棒性。
技术关键词
融合定位方法
声源定位算法
多声源
非暂态计算机可读存储介质
融合定位装置
声源定位技术
数值
处理器
数据
加权算法
波束
计算机程序产品
模块
存储器
鲁棒性
电子设备
广义
通道
系统为您推荐了相关专利信息
可见光图像
特征融合方法
融合特征
编码器
注意力机制
文本
字符
预训练语言模型
命名实体识别装置
门控循环单元
视频配音方法
字幕
情绪识别模型
文本生成模型
音频特征参数