摘要
本申请涉及语音识别技术领域,特别是涉及到一种易混词确认方法、装置、设备及存储介质,其中方法包括:基于预设的命令词语料在初始语音识别模型上进行训练,得到优化识别模型;将真实命令词语料输入到优化识别模型中,提取每个音频片段的嵌入表示;根据提取的嵌入表示,构建每个音素的嵌入表示词典;当接收到新的语音输入时,通过优化识别模型生成对应音频的嵌入序列;基于嵌入表示词典,获取所述嵌入序列对应的易混淆命令词列表中所有易混命令词的音素嵌入表示序列;计算输入音频的嵌入序列与易混淆命令词的音素嵌入表示序列之间的相似度,得到最终识别结果。本申请显著提升语音识别系统对易混淆命令词的识别准确性。
技术关键词
语音识别模型
命令
音频
序列
词语
词典
列表
度度量方法
语音识别系统
语音识别技术
损失率
回溯算法
错误率
模块
处理器
计算机设备
可读存储介质
存储器
系统为您推荐了相关专利信息
容量估计方法
时间预测模型
电池等效电路模型
内阻
恒流充电
智慧水务系统
调度优化方法
调度优化装置
数据
排水设施