多声源的融合定位方法、装置、设备、存储介质和产品

AITNT
正文
推荐专利
多声源的融合定位方法、装置、设备、存储介质和产品
申请号:CN202410963868
申请日期:2024-07-17
公开号:CN118671700B
公开日期:2024-12-06
类型:发明专利
摘要
本申请涉及声源定位技术领域,提供多声源的融合定位方法、装置、设备、存储介质和产品,该方法包括:采用第一声源定位算法对声音数据进行峰值检测,得到第一峰值结果;在包括至少两个峰值的情况下,确定至少两个峰值中的最大能量声源作为初步主声源;检测第二峰值结果和第三峰值结果中是否存在峰值落入第一角度范围,以得到第一检测结果;第一角度范围是根据初步主声源的角度位置确定的;第二峰值结果是采用第二声源定位算法对声音数据进行峰值检测得到的;第三峰值结果是采用第三声源定位算法对声音数据进行峰值检测得到的;根据第一检测结果确定主声源的定位结果。本申请可以在多声源混响的情况下,实现良好的定位效果,提升整体鲁棒性。
技术关键词
融合定位方法 声源定位算法 多声源 非暂态计算机可读存储介质 融合定位装置 声源定位技术 数值 处理器 数据 加权算法 波束 计算机程序产品 模块 存储器 鲁棒性 电子设备 广义 通道
系统为您推荐了相关专利信息
1
用于红外和可见光图像的特征融合方法及系统
可见光图像 特征融合方法 融合特征 编码器 注意力机制
2
一种基于机器视觉的图文印刷质量分析系统及方法
分析方法 图文 图像语义识别 文本 图像特征识别
3
畜禽疫病嵌套命名实体识别方法和装置
文本 字符 预训练语言模型 命名实体识别装置 门控循环单元
4
视频配音方法、装置、电子设备及存储介质
视频配音方法 字幕 情绪识别模型 文本生成模型 音频特征参数
5
基于时序状态感知的深度强化学习车辆边缘计算卸载方法及相关设备
深度强化学习 卸载方法 车辆 前馈神经网络 时序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号