摘要
本公开涉及文本纠错技术领域,具体涉及一种语音识别后的文本纠错方法、装置、设备及存储介质,方法包括:对原始文本进行文本转语音,确定语音信号;对语音信号进行识别,确定文本识别内容;将原始文本与文本识别内容组合为训练数据集,对预设大模型进行微调,包括:确定语音信号的高维语音特征;将高维语音特征与文本识别内容进行多模态融合,作为预设大模型的输入数据;根据输入数据与原始文本,对预设大模型进行微调;采用微调后的预设大模型,对输入语音进行语音识别后的文本纠错。本公开通过高频语音特征与文本识别内容的多模态融合对预设大模型进行微调,可以使大模型更易区分同音异形词语,从而提高针对同音异形词的识别准确率。
技术关键词
自动语音识别系统
文本识别
文本纠错方法
语音特征
数据
多模态
上下文特征
文本纠错技术
一维卷积神经网络
信号
可读存储介质
纠错装置
纠错模块
大语言模型
指令
计算机程序产品