多人声源分离方法、装置、设备、介质和计算机程序产品

正文

推荐专利

申请号：CN202510238450

申请日期：2025-03-03

公开号：CN119741938A

公开日期：2025-04-01

类型：发明专利

摘要

本发明提供一种多人声源分离方法、装置、设备、介质和计算机程序产品，涉及音频信号处理技术领域。该方法包括：获取包含多人语音的语音片段；基于各个麦克风单元的物理位置，利用ODAS算法确定各个声源的方位角；根据各个声源的方位角，确定各个声源的标识符；基于各个声源的标识符，从语音片段中读取各标识符对应的语音片段分段；将属于同一标识符的语音片段分段作为与同一标识符对应的说话人的独立语音段。该方法不需要事先训练好的人工智能模型，不需要预先标注大量声纹数据，根据麦克风阵列采集到的不同声源的方位角即可分离出不同说话人的独立语音片段，在保证了语音识别准确性的同时，降低了计算资源，从而降低了成本。

技术关键词

麦克风单元标识符人声方位角分段计算机程序产品音频信号处理技术语音识别准确性语音降噪算法非暂态计算机可读存储介质麦克风阵列采集声学特征物理人工智能模型处理器时间差波束成形

系统为您推荐了相关专利信息

一种图文互动的思维机控制系统及方法

上下文标识符机控制方法分布式会话多模态协同资源池管理

一种智慧园区的能耗数据实时监测方法

数据实时监测方法能耗分段电力 ARIMA模型

装置、系统、含芯片产品和非暂态计算机可读介质

延迟电路系统检测电路系统指令数据执行数据处理标识符

3D虚拟数字人的交互系统及方法

交互方法意图随机森林模型输入设备样本

一种任务调度方法和装置

任务调度算法任务调度方法任务调度装置分段动态

多人声源分离方法、装置、设备、介质和计算机程序产品

站点导航

APP 下载