摘要
一种基于汉语言发音的语音识别方法,包括如下步骤:S1.发现误识别现象,确定命令词;S2.将声音片段转化得到声音片段文档;S3.将命令词去掉声调得到命令词无声调发音;S4.将声音片段文档去掉声调得到声音片段无声调发音;S5.将命令词无声调发音首个音节与声音片段无声调发音进行对比,找出相同的第一个音节;S6.将最后一个音节与声音片段无声调发音进行对比,找出相同的第一个音节;S7.得到负性词组;S8.将负性词组加入语言模型。本发明通过提炼比对误识别命令词与声音片段,可以准确提炼出声音片段中与命令词相似的负性词组,将负性词组带入语音模型,通过提炼扩展负性词组,提高语音模型的识别率。