摘要
本申请公开了一种语音识别纠错方法、装置、服务器、计算机可读存储介质以及计算机程序产品。该方法将大语言模型应用到语音识别纠错任务中,直接将声学模型生成帧级别的音素概率分布全部输入到经过预训练的大语言模型中,尽可能多的保留了有用信息,大语言模型根据前后帧的全局信息进行语音识别纠正,根据全局信息进行语音识别纠正,对于上下文理解更全面,在纠错任务中能够检测到更复杂的语法错误、逻辑错误和事实错误,从而提供了更全面、一致和连贯的结果。
技术关键词
语音识别纠错方法
大语言模型
语音特征提取
生成帧
计算机程序产品
语音标签
特征提取单元
冗余
处理器
可读存储介质
纠错装置
数据处理单元
服务器
存储器