摘要
本发明提供一种多人声源分离方法、装置、设备、介质和计算机程序产品,涉及音频信号处理技术领域。该方法包括:获取包含多人语音的语音片段;基于各个麦克风单元的物理位置,利用ODAS算法确定各个声源的方位角;根据各个声源的方位角,确定各个声源的标识符;基于各个声源的标识符,从语音片段中读取各标识符对应的语音片段分段;将属于同一标识符的语音片段分段作为与同一标识符对应的说话人的独立语音段。该方法不需要事先训练好的人工智能模型,不需要预先标注大量声纹数据,根据麦克风阵列采集到的不同声源的方位角即可分离出不同说话人的独立语音片段,在保证了语音识别准确性的同时,降低了计算资源,从而降低了成本。
技术关键词
麦克风单元
标识符
人声
方位角
分段
计算机程序产品
音频信号处理技术
语音识别准确性
语音降噪算法
非暂态计算机可读存储介质
麦克风阵列采集
声学特征
物理
人工智能模型
处理器
时间差
波束成形
系统为您推荐了相关专利信息
上下文标识符
机控制方法
分布式会话
多模态协同
资源池管理
数据实时监测方法
能耗
分段
电力
ARIMA模型
延迟电路系统
检测电路系统
指令
数据执行数据处理
标识符
任务调度算法
任务调度方法
任务调度装置
分段
动态