一种基于知识图谱的领域内模型训练方法和系统

AITNT
正文
推荐专利
一种基于知识图谱的领域内模型训练方法和系统
申请号:CN202411806009
申请日期:2024-12-10
公开号:CN119294461A
公开日期:2025-01-10
类型:发明专利
摘要
本发明公开了一种基于知识图谱的领域内模型训练方法和系统,属于人工智能技术领域,方法包括:构建领域知识图谱;从领域知识图谱中提取新增高频专业术语;为每个新增高频专业术语生成新增词元并集成到预训练大语言模型的词表中得到扩充后的词表;利用知识图谱中的实体嵌入向量初始化词元的词嵌入向量,基于扩充后的词表中新增词元的词嵌入向量调整预训练大语言模型的词嵌入层并进行再训练;将基于领域知识图谱构建的问答对经专家审核完善后作为指令微调数据集,对再训练后的大语言模型进行微调;进行模型性能评估和持续优化。本发明能提供更为全面的词表并提高模型对特定领域词汇的理解能力,提高模型训练效率,适用于领域内大语言模型训练。
技术关键词
模型训练方法 大语言模型 知识图谱构建 实体 生成模板 扩充模块 数据 模型训练系统 指令 答案 损失函数优化 文本 初始化方法 存储计算机程序 专业 人工智能技术 关系
系统为您推荐了相关专利信息
1
一种用于科学文献趋势稳定识别的时序语义对齐方法
关键词 对齐方法 层次聚类算法 语义 大语言模型
2
融合增强实体与多级表示的文档级关系抽取
节点 注意力 异质 关系抽取技术 邻居
3
图像去噪方法、模型训练方法及装置、设备和程序产品
注意力 图像去噪方法 上采样 模型训练方法 样本
4
基于大数据的客户画像分析的风险识别方法及其系统
客户 风险识别方法 画像 金融 大数据
5
一种电梯控制方法及系统
电梯控制系统 电梯控制方法 意图识别 电梯运行参数 深度学习模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号