一种基于知识图谱的大语言模型训练方法

AITNT
正文
推荐专利
一种基于知识图谱的大语言模型训练方法
申请号:CN202510232675
申请日期:2025-02-27
公开号:CN120069087A
公开日期:2025-05-30
类型:发明专利
摘要
本发明公开了一种基于知识图谱的大语言模型训练方法,包括收集特定领域的专业文本数据并从中进行实体与关系抽取,构建为领域知识图谱,基于不同数据源的数据构建知识图谱,其基础是基于外网;将所述领域知识图谱带入内网中,并存储在内网中的知识库中,从领域知识图谱中提取专业术语,分析专业术语在专业文本数据中的词频,选取词频高于设定阈值的专业术语作为新增高频专业术语。本发明通过构建目标领域的专业知识图谱,基于专业知识图谱,对大语言模型进行微调,生成专业知识大语言模型。
技术关键词
语言模型训练方法 大语言模型 构建知识图谱 文本 生成训练数据 知识图谱构建 深度优先搜索算法 实体命名识别 关系抽取技术 生成自然语言 格式化方法 生成训练样本 数据采集方式 节点 三元组 模板方法 答案
系统为您推荐了相关专利信息
1
一种针对专业领域的跨模态图文检索方法
适配器 图文检索方法 节点 微调技术 专业
2
基于多模态融合的患者信息分析方法、装置、设备及介质
肝部CT图像 深度学习模型 信息分析方法 跨模态融合特征 模态特征
3
基于原型引导模态融合与提示增强的情感分析方法
原型 多模态情感分析 情感类别 情感分析方法 样本
4
基于增量预训练的社会诉求数据的文本分类优化方法
分类优化方法 BERT模型 文本分类算法 命名实体识别 社会
5
融合神经崩塌检测与调控的个性化学习长尾数据处理方法
文本 数据处理方法 分类准确率 训练集 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号