摘要
本发明涉及人工智能技术领域及金融科技领域,公开了一种语音识别纠错方法,通过收集目标领域的对话汉字文本,训练生成目标领域汉字文本理解模型;收集拼音数据,训练生成拼音理解模型;接收待检测语音数据并转换为待检测汉字文本和拼音文本;输入汉字文本和拼音文本至相应理解模型,生成语义特征和拼音特征;合并语义特征和拼音特征形成联合特征;将联合特征输入语音识别错误检测模型,生成每个词语的错误概率分布,输出错误标签;基于错误标签,通过模板纠错模块对汉字文本进行纠正。本发明通过结合语义特征和拼音特征,形成更加全面的特征表示,提高了语音识别错误检测的准确性;利用模板纠错模块,能够有效修正识别错误。
技术关键词
语音识别纠错方法
语音识别错误
汉字
拼音
文本理解
关键词
纠错模块
纠错程序
词语
标签
模板
纠错装置
错误检测模块
语义特征提取
数据转换模块
计算机设备