一种基于因果关系感知的大语言模型微调方法及装置

正文

推荐专利

申请号：CN202510025727

申请日期：2025-01-08

公开号：CN119443182B

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开一种基于因果关系感知的大语言模型微调方法及装置，涉及自然语言处理技术领域；针对古文理解的应用场景，对大语言模型进行微调，包括：步骤1：准备数据：构建繁体古文数据集，步骤2：准备预训练基础模型，步骤3：根据繁体古文数据集，形成微调数据集，并对微调数据集的数据进行扩展与处理，步骤4：加载预训练模型，根据微调数据集对预训练后的中文LLama模型基于因果关系进行微调，步骤5：对迭代微调后中文LLama模型进行评估优化，获得模型的性能指标，步骤6：根据模型的性能指标选择最佳模型，本发明通过因果分析识别训练数据中的因果关系，并以此为依据指导模型参数的高效更新。

技术关键词

因果关系模型结构方程模型微调方法数据预训练模型自动化工具策略参数模块变量微调装置基础序列动态文本强度网络分词自然语言同义词

系统为您推荐了相关专利信息

船舶结构制作图出图方法、系统、设备、介质和程序产品

船舶结构专用数据库零件图纸对象

电力巡检的方法、电子设备、存储介质及程序产品

语义电力巡检多分辨率计算机执行指令网格

在分布式环境中调整应用的代码库和更新应用的方法和系统

代码库分布式环境依赖关系信息站点自然语言文本

一种基于大语言模型的实体消歧和遗忘方法及系统

大语言模型样本更新模型参数生成数据集实体消歧技术

一种基于贝叶斯优化的无人机轨迹预测方法、装置和系统

历史轨迹数据轨迹预测方法前馈神经网络轨迹预测装置生成预测模型

一种基于因果关系感知的大语言模型微调方法及装置

站点导航

APP 下载