摘要
本申请提供了一种语音识别方法和装置、电子设备及存储介质,属于金融科技技术领域。方法包括:获取包含多个说话人的目标语音数据;基于语音识别模型对目标语音数据进行编码处理,得到语音编码特征,语音识别模型包括语音识别网络、和说话人识别网络;基于语音识别网络对语音编码特征进行内容识别,得到目标语音数据对应的语音文本内容;基于说话人识别网络对目标语音数据、和语音编码特征进行说话人识别,得到目标语音数据对应的说话人声纹特征;基于说话人声纹特征,对语音文本内容中的各个文本字符进行分类,得到每个说话人所产生的目标语音内容,目标语音内容由多个文本字符组成。本申请能够提高对包含多个说话人的语音的识别准确性。
技术关键词
声纹特征
说话人识别
语音识别网络
语音编码
语音识别方法
语音识别模型
样本
文本
字符
数据
解码器
音频编码
语音识别装置
编码特征
金融科技技术
电子设备
标识
系统为您推荐了相关专利信息
后处理模块
同声传译方法
语音编码器
共享语言模型
离线
声音识别系统
声音采集模块
颈部可穿戴装置
压电纤维阵列
环境光照强度