摘要
本发明公开了一种基于大语言模型学习和增强的水利领域规则抽取方法,将本体及标注文档输入大语言模型中进行解析,以生成水利领域知识提示并构建离线提示知识树;构建待抽取语句的词性序列,为后续关键字检索提供结构的数据基础;利用大语言模型对词性序列中的水利关键字和专有词进行离线提示知识树的检索,以找到与之匹配的提示语句,并生成匹配的提示清单;引入伪标签简化水利规则本体的表达形式;集成提示清单和本体表达式,自动构建适合水利领域规则的抽取模板,完成领域规则的信息抽取。本发明能够有效的提高领域知识三元组抽取的准确率,还可以有效提升对业务规则的识别能力,降低复杂业务规则对于信息抽取人员的理解难度。
技术关键词
规则抽取方法
大语言模型
水利
语句
分支
三元组
关系结构信息
关键字
离线
模板
序列
实体
启发式策略
文本
概念
对象
标签
树状结构
表达式