摘要
本申请涉及到语音识别技术领域,公开了语音识别中多发音问题的处理的方法、装置、设备及介质,其方法包括:构建文本语料,并将所述文本语料中包含的单词序列转为音素序列;基于所述音素序列,通过音素拼接构造伪单词;使用伪单词替换发音词典中的单词;将所有伪单词按照发音词典的格式整理成伪单词列表,并更新发音词典;使用更新后的所述发音词典对语音识别模型进行区分性训练。本申请解决了命令词识别过程中多发音问题导致的识别准确性下降的问题,通过伪单词的构造和替换,显著减少了网络模型占用的空间和解码所需的空间,使得该方法能够在资源极低的设备上进行部署。
技术关键词
发音词典
语音识别模型
序列
文本
列表
格式
语音识别技术
可读存储介质
存储计算机程序
处理器
模块
分词
解码
命令
校正
存储器
系统为您推荐了相关专利信息
大语言模型
计算机设备
文本处理方法
处理器
可读存储介质
运维平台
智慧消防
火灾检测系统
风险
实时监测数据
语音识别模型
训练集
样本
识别语音数据
语音识别方法