摘要
本发明公开了一种基于大模型的文本错误识别方法及相关装置,可以对目标政务文档进行预处理,得到对应的多个句段,其中,所述预处理包括文本清洗、文本分句和文本标准化;基于预先建立的知识库和大模型,对各所述句段分别进行错误检测,得到对应的检测结果,其中,所述错误检测包括:常识错误检测、数值单位错误检测、逻辑矛盾检测、时间矛盾检测、数值前后矛盾检测、数据不完整检测、计算错误和语句重复;基于所述检测结果,生成相应的检测报告和文本修改建议。由此可以看出,本发明可以基于知识库和大模型,准确识别出政务文档中存在的错误,并生成报告和给出修改意见,效率较高且准确率较高。
技术关键词
错误识别方法
文本
政务
错误检测单元
数值
错误识别装置
语句
表达式
数学
字段
逻辑
大语言模型
生成报告
日期
数据
算法
时间段
地点