摘要
本申请公开了一种多声道语音识别方法、装置、设备及介质。通过判断任意两个声道的有效语音段是否满足预先配置的信号混合条件,能够精确识别出哪些有效语音段之间可能发生了信号混合问题。信号混合条件结合了内容交集和时间交集两个方面的判断。内容交集确保了语音内容的相似性,而时间交集则确保了这种相似性是在同一时间段内发生的,通过该种信号混合条件,有利于精准识别出存在信号混合问题的两个有效语音段。当确定两个声道的有效语音段满足信号混合条件时,可以进一步比较内容交集在两个声道中的能量大小,并选择保留能量较大的语音段的内容交集。这种方法能够减少因信号混合而产生的错误识别,从而提高语音识别结果的准确性。
技术关键词
语音识别方法
多声道
信号
声纹特征
语音活动检测
语音识别单元
语音识别装置
计算机设备
时间段
处理器
数据
可读存储介质
算法
存储器