摘要
本申请涉及一种针对教材提取知识谱图的方法、设备及存储介质,属于大模型技术领域。通过获取多源异构数据;进行分离得到文本类教材数据以及非文本类教材数据;将所述文本类教材数据输入到大语言模型中,识别所述文本类教材数据的目录结构;并根据所述目录结构,得到每个章节的定位内容信息;识别章节中的实体、关联关系以及属性信息;基于所述实体、关联关系以及属性信息,构建每个章节的知识点子图;将所有章节的知识点子图融合为全局知识图谱;将所述非文本类教材数据关联到所述全局知识图谱对应的知识点节点上。本申请显著降低了人工参与,提高了整体知识图谱构建过程的自动化水平和精度,实现了从章节子图到全局图谱的分级构建。
技术关键词
知识点
大语言模型
文本
多源异构数据
实体
节点
书籍
关系
语义分析技术
图片
知识图谱构建
目录
视频
字幕
处理器
术语
可读存储介质
系统为您推荐了相关专利信息
智能问答系统
答案
智能问答方法
预训练语言模型
动态
交互特征
动态障碍物
机器人
视觉特征
交叉注意力机制
智能协作
云系统
分布式云
专业词库
TensorFlow框架
模式优化方法
设备系统
深度确定性策略梯度
设备运行数据
多模态