一种多声道语音识别方法、装置、设备及介质

正文

推荐专利

申请号：CN202411470891

申请日期：2024-10-21

公开号：CN119296522A

公开日期：2025-01-10

类型：发明专利

摘要

本申请公开了一种多声道语音识别方法、装置、设备及介质。通过判断任意两个声道的有效语音段是否满足预先配置的信号混合条件，能够精确识别出哪些有效语音段之间可能发生了信号混合问题。信号混合条件结合了内容交集和时间交集两个方面的判断。内容交集确保了语音内容的相似性，而时间交集则确保了这种相似性是在同一时间段内发生的，通过该种信号混合条件，有利于精准识别出存在信号混合问题的两个有效语音段。当确定两个声道的有效语音段满足信号混合条件时，可以进一步比较内容交集在两个声道中的能量大小，并选择保留能量较大的语音段的内容交集。这种方法能够减少因信号混合而产生的错误识别，从而提高语音识别结果的准确性。

技术关键词

语音识别方法多声道信号声纹特征语音活动检测语音识别单元语音识别装置计算机设备时间段处理器数据可读存储介质算法存储器

一种多声道语音识别方法、装置、设备及介质

站点导航

APP 下载