摘要
本发明涉及一种结合深度语义匹配与知识图谱的变电设备缺陷文本规范化方法及系统,该方法包括:将实际变电设备缺陷文本输入文本实体识别模型,提取出缺陷文本中的实体作为待标准化实体,查询缺陷文本对应的设备型号及缺陷等级,由设备型号得到缺陷设备种类;将缺陷标准中对应实体类型的所有标准描述作为候选标准实体,依次与待标准化实体组成实体对,将组成的实体对输入FTS‑BERT中,匹配出实体的标准描述;构建变电设备缺陷知识图谱;结合FTS‑BERT与知识图谱图搜索,将变电设备缺陷文本规范化为统一形式;将新知识通过增量更新加入原有知识图谱中。该方法及系统能够自动、有效地完成变电设备文本规范化任务,解决缺陷文本数据因人工记录而导致的不规范问题。
技术关键词
文本规范化
变电设备
缺陷现象
文本实体识别
语义向量
计算机程序指令
判断缺陷
增量更新
语义实体
节点
搜索算法
知识图谱构建
BERT模型
阶段
唯一性
关系