摘要
本申请实施例提供了一种语音识别方法、装置、设备和存储介质,其中语音识别方法包括:接收目标语音信号,所述目标语音信号包含一个或多个说话人的语音信号;获取所述目标语音信号的目标声学特征序列;根据所述目标声学特征序列生成目标编码序列;根据所述目标编码序列生成与所述目标语音信号对应的掩蔽文本;根据所述目标编码序列和掩蔽文本生成对应一个或多个说话人的语音识别内容。该方法可以实现有效减少多说话人自动语音识别系统固有的上下文破碎和语义混淆的问题,显著提高自动语音识别性能。
技术关键词
声学特征
语音识别方法
文本
序列
掩码矩阵
信号
自动语音识别系统
编码块
频谱特征
上存储计算机程序
语音识别装置
可读存储介质
处理器
编码器
识别模块
存储器