一种基于专家知识库的特定领域模型训练方法

AITNT
正文
推荐专利
一种基于专家知识库的特定领域模型训练方法
申请号:CN202510192148
申请日期:2025-02-21
公开号:CN119691178B
公开日期:2025-06-06
类型:发明专利
摘要
本发明涉及文本数据处理技术领域,具体涉及一种基于专家知识库的特定领域模型训练方法,该方法包括:对获取的初始通用知识库和初始专家知识库中的每个文本中的每个句子进行分词处理;确定每两个文本之间的目标相似度;对所有文本进行聚类,并对初始专家知识库和初始通用知识库分别进行扩充和删减;确定初始专家知识库中每个目标分词对应的目标专业贡献程度和每个句子对应的目标学习率;将初始专家知识库中各个句子对应在LoRA模型中的缩放因子更新为其对应的目标学习率,并通过LoRA模型,对语言模型进行微调,得到训练完成的语言模型。本发明通过对知识库中的文本数据进行处理,提高了对特定领域下的语言模型进行训练时的合理性。
技术关键词
专家知识库 分词 模型训练方法 专业 标记 DBSCAN算法 文本数据处理技术 上下文无关文法 编辑 关键词 聚类 度量 关系 因子 核心 对象
系统为您推荐了相关专利信息
1
一种基于污水总氮处理的费效评估及优化系统
评估预测模型 实时数据 污水 周期 水质
2
基于个体优势度分析的职业教学规划方法和系统
职业教学 专业 时间预测模型 学生学习数据 序列
3
一种基于物价指数的西藏电网工程人工价格动态调整系统
数据采集模块 动态 高原 生活必需品类 电网工程管理
4
缺陷图像生成方法、模型训练方法、装置、介质及产品
图像生成模型 特征提取模块 噪声图像 图像生成方法 数据矩阵相乘
5
信息抽取方法、装置、设备、存储介质及计算机程序产品
信息抽取模型 信息抽取方法 计算机程序产品 数据 信息抽取设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号