语音识别后的文本纠错方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510403821

申请日期：2025-04-01

公开号：CN120260573A

公开日期：2025-07-04

类型：发明专利

摘要

本公开涉及文本纠错技术领域，具体涉及一种语音识别后的文本纠错方法、装置、设备及存储介质，方法包括：对原始文本进行文本转语音，确定语音信号；对语音信号进行识别，确定文本识别内容；将原始文本与文本识别内容组合为训练数据集，对预设大模型进行微调，包括：确定语音信号的高维语音特征；将高维语音特征与文本识别内容进行多模态融合，作为预设大模型的输入数据；根据输入数据与原始文本，对预设大模型进行微调；采用微调后的预设大模型，对输入语音进行语音识别后的文本纠错。本公开通过高频语音特征与文本识别内容的多模态融合对预设大模型进行微调，可以使大模型更易区分同音异形词语，从而提高针对同音异形词的识别准确率。

技术关键词

自动语音识别系统文本识别文本纠错方法语音特征数据多模态上下文特征文本纠错技术一维卷积神经网络信号可读存储介质纠错装置纠错模块大语言模型指令计算机程序产品