一种基于因果关系感知的大语言模型微调方法及装置

AITNT
正文
推荐专利
一种基于因果关系感知的大语言模型微调方法及装置
申请号:CN202510025727
申请日期:2025-01-08
公开号:CN119443182B
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开一种基于因果关系感知的大语言模型微调方法及装置,涉及自然语言处理技术领域;针对古文理解的应用场景,对大语言模型进行微调,包括:步骤1:准备数据:构建繁体古文数据集,步骤2:准备预训练基础模型,步骤3:根据繁体古文数据集,形成微调数据集,并对微调数据集的数据进行扩展与处理,步骤4:加载预训练模型,根据微调数据集对预训练后的中文LLama模型基于因果关系进行微调,步骤5:对迭代微调后中文LLama模型进行评估优化,获得模型的性能指标,步骤6:根据模型的性能指标选择最佳模型,本发明通过因果分析识别训练数据中的因果关系,并以此为依据指导模型参数的高效更新。
技术关键词
因果关系模型 结构方程模型 微调方法 数据 预训练模型 自动化工具 策略 参数 模块 变量 微调装置 基础 序列 动态 文本 强度 网络 分词 自然语言 同义词
系统为您推荐了相关专利信息
1
船舶结构制作图出图方法、系统、设备、介质和程序产品
船舶结构 专用数据库 零件 图纸 对象
2
电力巡检的方法、电子设备、存储介质及程序产品
语义 电力巡检 多分辨率 计算机执行指令 网格
3
在分布式环境中调整应用的代码库和更新应用的方法和系统
代码库 分布式环境 依赖关系信息 站点 自然语言文本
4
一种基于大语言模型的实体消歧和遗忘方法及系统
大语言模型 样本 更新模型参数 生成数据集 实体消歧技术
5
一种基于贝叶斯优化的无人机轨迹预测方法、装置和系统
历史轨迹数据 轨迹预测方法 前馈神经网络 轨迹预测装置 生成预测模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号