混识别的处理方法、装置、设备及存储介质

AITNT
正文
推荐专利
混识别的处理方法、装置、设备及存储介质
申请号:CN202410930401
申请日期:2024-07-11
公开号:CN118658475A
公开日期:2024-09-17
类型:发明专利
摘要
本申请涉及语音识别技术领域,提供一种混识别的处理方法、装置、设备及存储介质,方法包括:对输入的语音计算其特征,然后送入语音识别网络,输出一音素概率分布列,同时记录该音素概率分布列的时间戳;将输出的音素概率分布列缓存到一个缓存窗口中;当缓存窗口中新来一音素概率分布列时,基于新来的音素概率分布列的时间戳和缓存窗口中所有音素概率分布列的时间戳确定过期的音素概率分布列;将过期的音素概率分布列从缓存窗口中清理掉,得到清理后的缓存窗口;基于清理后的缓存窗口进行解码操作,获得命令词的识别结果。本申请可以解决重复喊同一命令词容易引起混识别技术问题,提高命令词识别的准确性。
技术关键词
语音识别网络 时间差 命令 语音识别算法 语音识别技术 解码算法 解码模块 处理器 计算机设备 识别模块 可读存储介质 存储器
系统为您推荐了相关专利信息
1
一种基于中间语言的源码二进制匹配方法
语句 预训练模型 节点特征 程序 分词
2
无线BMS的抗干扰方法、系统和存储介质
抗干扰方法 通信信道 主节点 损耗算法 时间差
3
一种磁悬浮电机绕组电流预测方法
磁悬浮电机 电流预测方法 电流值 电流预测控制方法 周期
4
一种基于音频增强的音视频语音识别方法及系统
语音识别方法 音视频 视觉特征提取 音频特征提取 机器可读程序
5
一种钢筋混凝土裂缝深度反演分析方法、设备及存储介质
钢筋混凝土裂缝 分析方法 钢筋混凝土梁 钢筋混凝土结构 蜂群算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号