多声源的融合定位方法、装置、设备、存储介质和产品

正文

推荐专利

申请号：CN202410963868

申请日期：2024-07-17

公开号：CN118671700B

公开日期：2024-12-06

类型：发明专利

摘要

本申请涉及声源定位技术领域，提供多声源的融合定位方法、装置、设备、存储介质和产品，该方法包括：采用第一声源定位算法对声音数据进行峰值检测，得到第一峰值结果；在包括至少两个峰值的情况下，确定至少两个峰值中的最大能量声源作为初步主声源；检测第二峰值结果和第三峰值结果中是否存在峰值落入第一角度范围，以得到第一检测结果；第一角度范围是根据初步主声源的角度位置确定的；第二峰值结果是采用第二声源定位算法对声音数据进行峰值检测得到的；第三峰值结果是采用第三声源定位算法对声音数据进行峰值检测得到的；根据第一检测结果确定主声源的定位结果。本申请可以在多声源混响的情况下，实现良好的定位效果，提升整体鲁棒性。

技术关键词

融合定位方法声源定位算法多声源非暂态计算机可读存储介质融合定位装置声源定位技术数值处理器数据加权算法波束计算机程序产品模块存储器鲁棒性电子设备广义通道

系统为您推荐了相关专利信息

用于红外和可见光图像的特征融合方法及系统

可见光图像特征融合方法融合特征编码器注意力机制

一种基于机器视觉的图文印刷质量分析系统及方法

分析方法图文图像语义识别文本图像特征识别

畜禽疫病嵌套命名实体识别方法和装置

文本字符预训练语言模型命名实体识别装置门控循环单元

视频配音方法、装置、电子设备及存储介质

视频配音方法字幕情绪识别模型文本生成模型音频特征参数

基于时序状态感知的深度强化学习车辆边缘计算卸载方法及相关设备

深度强化学习卸载方法车辆前馈神经网络时序

多声源的融合定位方法、装置、设备、存储介质和产品

站点导航

APP 下载