一种大模型的分布式量化感知训练方法及系统

正文

推荐专利

申请号：CN202510844861

申请日期：2025-06-23

公开号：CN120930727A

公开日期：2025-11-11

类型：发明专利

摘要

本发明属于大模型训练技术领域，具体涉及一种大模型的分布式量化感知训练方法及系统，包括：获取待训练的大模型的配置参数信息，构建大模型的损失函数，计算梯度范数，得到大模型的一阶梯度信息感知评分；对大模型添加扰动，构建大模型的含扰动损失函数，计算海森矩阵，得到大模型的海森梯度信息感知评分；对所得到的一阶梯度信息感知评分和海森梯度信息感知评分进行自适应加权组合，得到大模型的量化感知评分，确定大模型量化感知训练样本，完成大模型的分布式量化感知训练。本发明结合梯度准则和黑森矩阵，通过自适应加权机制实现大模型的量化感知训练，在实现大模型并行加速训练的同时，提高考虑量化的训练效率和量化效果。

技术关键词

阶梯模型训练技术数据并行处理矩阵计算机程序产品训练系统处理器样本平方根模块参数可读存储介质存储器软件元素电子设备机制

系统为您推荐了相关专利信息

模型的训练、信息推荐方法、装置、电子设备及存储介质

预测点击概率样本编码特征信息推荐方法关系网络图

考虑机组风速限制的风电出力预测方法、装置、设备、介质及产品

风电出力预测方法集合经验模态分解方法风速风电机组重构

一种大气有机物种类识别方法及系统

薛定谔方程识别方法正则化参数离子矩阵分解算法

一种面向自主代客泊车（AVP）场景的轻量化语义点云建图方法

点云地图相机泊车坐标系矩阵

兼顾经济性与电压稳定性的储能装置功率配置方法及系统

功率配置方法储能装置储能设备网损灵敏度静态电压稳定

一种大模型的分布式量化感知训练方法及系统

站点导航

APP 下载