一种模型训练方法、文本纠错方法及相关产品

正文

推荐专利

申请号：CN202411715667

申请日期：2024-11-27

公开号：CN119647520A

公开日期：2025-03-18

类型：发明专利

摘要

本申请实施例提供了一种模型训练方法、文本纠错方法及相关产品，涉及机器学习技术领域。本申请提供的的模型训练方法通过引入包含拼写错误、语法错误、逻辑错误及格式错误等多种错误类型的模型训练数据，能够全面覆盖并识别待纠错文本中可能存在的各类错误。并且，通过机器学习模型的第一子模型对文本数据的分词结果进行掩蔽处理，通过第二子模型对文本数据的分词结果进行打乱处理，并根据标注数据、掩蔽处理后的结果和打乱处理后的结果训练机器学习模型，不仅增强了机器学习模型对错误模式的识别能力，还促进了机器学习模型对正确文本结构的学习能力，使得文本纠错模型在进行文本纠错时表现出更高的准确率。

技术关键词

模型训练方法文本纠错方法分词错误检测数据输入模块训练机器学习模型数据获取模块 BERT模型模型训练装置机器学习技术纠错文本纠错装置样本格式逻辑

系统为您推荐了相关专利信息

一种基于呼吸知识大语言模型的智能问答方法

大语言模型智能问答方法文本分词专业

一种基于自适应混沌神经网络的语言语义分析方法

混沌神经网络语义分析方法自然语言文本隐马尔可夫模型语义特征

餐厅推荐及模型训练方法、装置、计算机设备和存储介质

推荐模型训练方法餐厅推荐方法静态特征计算机可执行指令计算机设备

大模型驱动的树索引结构在RAG内容解析中的应用方法

节点列表数据关键词字符

一种交互式智能排故引导方法、系统、设备及介质

故障知识库交互式智能故障记录数据交互式电子技术手册排故方法

一种模型训练方法、文本纠错方法及相关产品

站点导航

APP 下载