摘要
本发明涉及一种利用大语言模型构建学科教材知识图谱的方法,该方法通过六步流程实现:首先,通过三轮对话引入自我提示框架,生成关系同义词、合成样本及句子变体,为后续关系抽取提供丰富语义引导;其次,借助专业领域指令模版,引导大语言模型从教材、习题和PPT文本中精准提取核心知识点实体;接着,运用多轮对话方式,结合合成样本提示,分别提取知识点的属性三元组和关系三元组;然后,将提取的三元组输入验证模块,通过迭代验证确保其准确性;最后,利用经学科知识微调的MPNet模型生成实体嵌入向量,并通过动态加权池化机制计算实体相似度,对相似度高的实体对进行判断,若表示同一概念则进行知识融合,否则推理潜在缺失关系并补全知识图谱。本发明能够高效、准确地从非结构化文本中自动构建特定学科课程的知识图谱,为相关学科教学和学习提供有力支持。
技术关键词
三元组
大语言模型
实体
知识点关系
文本
知识图谱构建方法
知识图谱补全
同义词
多轮对话
样本
概念
生成关系
指令
定义
训练语料库
更新模型参数
列表
系统为您推荐了相关专利信息
推理平台
动态知识图谱
电力分配系统
实体
三元组
关键信息提取方法
检测分类模型
联合损失函数
轻量级神经网络
图像训练样本