摘要
本发明公开了一种基于知识图谱的大语言模型训练方法,包括收集特定领域的专业文本数据并从中进行实体与关系抽取,构建为领域知识图谱,基于不同数据源的数据构建知识图谱,其基础是基于外网;将所述领域知识图谱带入内网中,并存储在内网中的知识库中,从领域知识图谱中提取专业术语,分析专业术语在专业文本数据中的词频,选取词频高于设定阈值的专业术语作为新增高频专业术语。本发明通过构建目标领域的专业知识图谱,基于专业知识图谱,对大语言模型进行微调,生成专业知识大语言模型。
技术关键词
语言模型训练方法
大语言模型
构建知识图谱
文本
生成训练数据
知识图谱构建
深度优先搜索算法
实体命名识别
关系抽取技术
生成自然语言
格式化方法
生成训练样本
数据采集方式
节点
三元组
模板方法
答案
系统为您推荐了相关专利信息
肝部CT图像
深度学习模型
信息分析方法
跨模态融合特征
模态特征
原型
多模态情感分析
情感类别
情感分析方法
样本
分类优化方法
BERT模型
文本分类算法
命名实体识别
社会