摘要
本申请实施例提供了一种设备知识图谱数据的标注方法及装置,属于工矿设备技术领域。该方法包括:采集多个工矿设备的设备特性数据,并对设备特性数据进行数据预处理,生成去除噪声且数据格式统一的数据源;获取标注模板,并将标注模板和数据源输入预训练大语言模型进行初步标注处理,生成多个工矿设备各自对应的初步标注数据,其中初步标注数据包括针对多个工矿设备对应的实体、实体类型和实体关系;基于数据源对多个工矿设备对应的实体、实体类型和实体关系进行半自动测评处理,生成最终标注数据。本申请解决了现有技术中的标注方法导致的人工成本和时间成本高,以及标注准确性低的问题。
技术关键词
工矿设备
设备特性数据
大语言模型
实体
知识图谱数据
标注方法
数据格式
模板
关系
噪声数据
数据管理模块
标注装置
定义
格式化
样本
字段
系统为您推荐了相关专利信息
NLP技术
关键词
模型更新
场景
计算机可读取存储介质
图谱
模式识别算法
计算机可读指令
校验工具
计算机设备
指标分析方法
异常数据
自然语言
项目管控技术
关键词
风险管理系统
自然语言
消防安全管理
风险智能评估
大语言模型