摘要
本发明实施例提供一种水电站资料的关系抽取方法及系统,属于数据处理技术领域。所述方法包括:对原始水电站资料执行预处理,并基于领域词表在预处理后的原始水电站资料中完成命名实体识别和术语归一化处理,作为待抽取数据;基于预构建的实体间的关系模式规则,在待抽取数据中执行候选关系实体识别;其中,所述实体间的关系模式规则基于水电站领域的技术规范和运行报告构建;基于优化的R‑BERT模型,对候选实体对进行语义分析和关系类型分类,作为抽取结果;通过预设领域规则执行关系抽取结果的合理性验证,并将验证通过的关系抽取结果格式化为结构化数据输出。本发明方案针对水电站资料的特点实现了抽取过程的精度、适配性和可靠性的全面提升。
技术关键词
水电站
BERT模型
关系抽取方法
命名实体识别
资料
格式化
语义
数据
上下文特征
关系抽取系统
术语
模式
条目
历史管理
三元组
可读存储介质
置信度阈值
验证规则
系统为您推荐了相关专利信息
URL检测方法
分层注意力
融合注意力机制
分析数据特征
BERT模型
文本
识别方法
节点
灾害数据采集
非暂态计算机可读存储介质
存储系统
双因子身份认证
文化遗产数字化保护
Fabric区块链
模块