摘要
本申请涉及大语言模型训练优化技术领域,具体涉及一种信创环境下的大语言模型训练及调优方法,该方法包括:创建大语言模型分布式训练任务,根据各国产服务器的国产算力分别在数据集中随机选取数据,获取各国产服务器的大语言模型中模型参数的梯度信息;构建各国产服务器的分词词典列表;通过计算任一国产服务器与其余各国产服务器之间分词词典列表中各相同分词的词向量的差异,获取所述任一国产服务器的模型拟合偏差;获取各国产服务器的特征系数;获取各国产服务器的模型权重;对主国产服务器的大语言模型中的模型参数进行更新。本申请旨在提高大语言模型的收敛速度和训练精度。
技术关键词
国产服务器
分词词典
大语言模型
数据
特征值
偏差
列表
参数
频率
单轮
节点
表达式
文本
精度
速度
系统为您推荐了相关专利信息
双层振动筛网
土壤湿度监测
数据处理单元
行进机构
控制模块
三维虚拟试衣系统
数据采集模块
服装三维模型
骨骼动画数据
三维模型模拟
语句
网页关键词
特征提取方法
客户
PageRank算法
荧光检测技术
微阵列技术
遗传多样性分析
标记
亲缘关系鉴定
信息安全单元
数据交换系统
云控平台
路侧单元
时间敏感网络