一种基于知识图谱的大语言模型训练方法

正文

推荐专利

一种基于知识图谱的大语言模型训练方法

申请号：CN202510232675

申请日期：2025-02-27

公开号：CN120069087A

公开日期：2025-05-30

类型：发明专利

摘要

本发明公开了一种基于知识图谱的大语言模型训练方法，包括收集特定领域的专业文本数据并从中进行实体与关系抽取，构建为领域知识图谱，基于不同数据源的数据构建知识图谱，其基础是基于外网；将所述领域知识图谱带入内网中，并存储在内网中的知识库中，从领域知识图谱中提取专业术语，分析专业术语在专业文本数据中的词频，选取词频高于设定阈值的专业术语作为新增高频专业术语。本发明通过构建目标领域的专业知识图谱，基于专业知识图谱，对大语言模型进行微调，生成专业知识大语言模型。

技术关键词

语言模型训练方法大语言模型构建知识图谱文本生成训练数据知识图谱构建深度优先搜索算法实体命名识别关系抽取技术生成自然语言格式化方法生成训练样本数据采集方式节点三元组模板方法答案

系统为您推荐了相关专利信息

一种针对专业领域的跨模态图文检索方法

适配器图文检索方法节点微调技术专业

基于多模态融合的患者信息分析方法、装置、设备及介质

肝部CT图像深度学习模型信息分析方法跨模态融合特征模态特征

基于原型引导模态融合与提示增强的情感分析方法

原型多模态情感分析情感类别情感分析方法样本

基于增量预训练的社会诉求数据的文本分类优化方法

分类优化方法 BERT模型文本分类算法命名实体识别社会

融合神经崩塌检测与调控的个性化学习长尾数据处理方法

文本数据处理方法分类准确率训练集样本

一种基于知识图谱的大语言模型训练方法

站点导航

APP 下载