一种信创环境下的大语言模型训练及调优方法

正文

推荐专利

申请号：CN202510499676

申请日期：2025-04-21

公开号：CN120338020A

公开日期：2025-07-18

类型：发明专利

摘要

本申请涉及大语言模型训练优化技术领域，具体涉及一种信创环境下的大语言模型训练及调优方法，该方法包括：创建大语言模型分布式训练任务，根据各国产服务器的国产算力分别在数据集中随机选取数据，获取各国产服务器的大语言模型中模型参数的梯度信息；构建各国产服务器的分词词典列表；通过计算任一国产服务器与其余各国产服务器之间分词词典列表中各相同分词的词向量的差异，获取所述任一国产服务器的模型拟合偏差；获取各国产服务器的特征系数；获取各国产服务器的模型权重；对主国产服务器的大语言模型中的模型参数进行更新。本申请旨在提高大语言模型的收敛速度和训练精度。

技术关键词

国产服务器分词词典大语言模型数据特征值偏差列表参数频率单轮节点表达式文本精度速度

系统为您推荐了相关专利信息

一种多源污染土壤修复处理装置及处理方法

双层振动筛网土壤湿度监测数据处理单元行进机构控制模块

一种动态展示的实时三维虚拟试衣系统及方法

三维虚拟试衣系统数据采集模块服装三维模型骨骼动画数据三维模型模拟

基于数据分析的客户行为特征提取方法

语句网页关键词特征提取方法客户 PageRank算法

一种猪全基因组低密度5K SNP芯片及应用

荧光检测技术微阵列技术遗传多样性分析标记亲缘关系鉴定

一种车路云协同数据交换系统

信息安全单元数据交换系统云控平台路侧单元时间敏感网络

一种信创环境下的大语言模型训练及调优方法

站点导航

APP 下载