摘要
本发明公开了一种用于检验的非结构化文本自动构建知识图谱的方法及系统,该方法包括:获取设备或者用户上传的业务数据的相关文本;将非结构化文本均转换为文本数据;切分成均匀的段落片段;将切片后的段落片段输入训练好的分类模型,得到段落片段以及对应的标签;以段落片段以及对应的标签作为输入,输入抽取模型,输出得到从段落片段中抽取得到的标签对应的指标的数值和以及与其他指标之间的关系,并与对应的指标的基准进行比对,得到打标结果;将打标结果根据已定义好的schema构建知识图谱。本发明可实现对某一行业领域、私有化数据或产品及实体设备信息的知识管理,有效提升文档数据的利用率以及用户触达知识的效率。
技术关键词
构建知识图谱
文本
指标
标签
定义
关系
数据
切片
数值
实体
基准
处理器
节点
存储器
装备
核心
元素
系统为您推荐了相关专利信息
空调控制策略
环境状态信息
大语言模型
文本
机房空调控制
语义信息提取
文本
字典
训练语言模型
计算机可执行指令
包络
训练样本数据
网络节点
正态分布曲线
皮尔逊相关系数