摘要
本发明涉及一种语音识别方法、模型的训练方法、装置、电子设备和车辆,包括对混合音频流进行特征提取,得到目标对象的第一音频特征和所述目标对象之外的其他对象的第二音频特征,混合音频流中包括至少两个对象的语音,目标对象为从至少两个对象中区分的一个对象;根据第一音频特征,获得目标对象发出的语音的第一特征向量;根据第二音频特征,预测得到与目标对象可能发出的语音关联的第二特征向量;根据第一特征向量和第二特征向量,识别得到混合音频流中目标对象发出的语音对应的目标文本。本发明实施例通过双路径提取的特征来识别混合音频流中目标对象的语音,可以提高对混合音频流的识别准确度。
技术关键词
音频特征
语音识别模型
对象
文本
长短期记忆网络
样本
语音识别方法
音频编码器
标签编码器
算法模型
存储计算机程序
参数
计算机程序产品
电子设备
系统为您推荐了相关专利信息
专家知识库
风险
特征提取模块
数据处理模块
干预方法
语音识别率
识别语音信息
混响时间
采样率
语音识别特征
旅游需求预测方法
BiLSTM模型
两阶段
计算机程序指令
特征选择方法
数据输出模块
中央处理器
超声波传感器
数据显示仪
信息采集模块