摘要
本发明公开了一种基于知识图谱的领域内模型训练方法和系统,属于人工智能技术领域,方法包括:构建领域知识图谱;从领域知识图谱中提取新增高频专业术语;为每个新增高频专业术语生成新增词元并集成到预训练大语言模型的词表中得到扩充后的词表;利用知识图谱中的实体嵌入向量初始化词元的词嵌入向量,基于扩充后的词表中新增词元的词嵌入向量调整预训练大语言模型的词嵌入层并进行再训练;将基于领域知识图谱构建的问答对经专家审核完善后作为指令微调数据集,对再训练后的大语言模型进行微调;进行模型性能评估和持续优化。本发明能提供更为全面的词表并提高模型对特定领域词汇的理解能力,提高模型训练效率,适用于领域内大语言模型训练。
技术关键词
模型训练方法
大语言模型
知识图谱构建
实体
生成模板
扩充模块
数据
模型训练系统
指令
答案
损失函数优化
文本
初始化方法
存储计算机程序
专业
人工智能技术
关系
系统为您推荐了相关专利信息
电梯控制系统
电梯控制方法
意图识别
电梯运行参数
深度学习模型