摘要
本发明提供一种水利知识结构化提取与校验方法及装置,属于人工智能技术领域,所述方法包括:对不同格式文件采用差异化文本处理生成中间文件;基于预设规则库将中间文件分类为条规类或非条规类;对条规类文件通过层级标题识别形成条目知识块,同时将表格内容转为HTML知识块;对非条规类文件进行语义分割生成知识块;实施知识块检验归档并标记异常告警块;利用大模型将表格知识块转化为自然语言描述;定位告警知识块原文上下文,通过大模型进行智能修正。本发明创新性融合传统语义分析模型与大语言模型,形成预处理、提取、校验、修正的闭环流程,解决水利领域复杂文本的结构化解析、及错误修正难题,显著提升知识处理效率与准确性。
技术关键词
校验方法
文本
水利
表格
生成知识
语义分析模型
生成PDF文件
滑动窗口
非暂态计算机可读存储介质
自然语言
处理单元
校验单元
校验模块
图片
流水线架构
标记
条目
人工智能技术
层级
系统为您推荐了相关专利信息
信息交互方法
宠物娱乐
生成算法
宠物健康
关系型数据库
虚拟试穿方法
模特
服装
Sigmoid函数
图像