摘要
本申请涉及语音识别技术领域,提供一种混识别的处理方法、装置、设备及存储介质,方法包括:对输入的语音计算其特征,然后送入语音识别网络,输出一音素概率分布列,同时记录该音素概率分布列的时间戳;将输出的音素概率分布列缓存到一个缓存窗口中;当缓存窗口中新来一音素概率分布列时,基于新来的音素概率分布列的时间戳和缓存窗口中所有音素概率分布列的时间戳确定过期的音素概率分布列;将过期的音素概率分布列从缓存窗口中清理掉,得到清理后的缓存窗口;基于清理后的缓存窗口进行解码操作,获得命令词的识别结果。本申请可以解决重复喊同一命令词容易引起混识别技术问题,提高命令词识别的准确性。
技术关键词
语音识别网络
时间差
命令
语音识别算法
语音识别技术
解码算法
解码模块
处理器
计算机设备
识别模块
可读存储介质
存储器
系统为您推荐了相关专利信息
磁悬浮电机
电流预测方法
电流值
电流预测控制方法
周期
语音识别方法
音视频
视觉特征提取
音频特征提取
机器可读程序
钢筋混凝土裂缝
分析方法
钢筋混凝土梁
钢筋混凝土结构
蜂群算法