摘要
本申请公开了一种语料库生成方法、装置、设备及存储介质,涉及知识图谱技术领域,包括:获取原始表数据,其中,原始表数据为结构化库表格式的数据;按照预设的图表征结构对原始表数据进行映射处理,得到映射后的原始表数据;对映射后的原始表数据进行格式转换,得到原始表数据对应的键值对数据;接收外部输入的第一指令,将第一指令以及键值对数据输入预设大模型,得到预设大模型输出的知识图谱,其中,预设大模型基于第一指令中的实际转换案例将键值对数据转换为图表征结构的知识图谱;基于多个原始表数据对应的知识图谱构建语料库。本申请实现了从结构化库表数据到知识图谱的自动转换。
技术关键词
语料库生成方法
数据
键值
实体
知识图谱构建
指令
预训练模型
自然语言
格式
生成知识图谱
知识图谱技术
生成装置
关系
生成设备
表头
模块
处理器
可读存储介质
存储器
系统为您推荐了相关专利信息
加密网络流量
半监督学习
网络流量数据
分类方法
序列
智能节能控制方法
环境感知数据
传感器校准
工作状态参数
环境光照强度