一种大模型的分布式量化感知训练方法及系统

AITNT
正文
推荐专利
一种大模型的分布式量化感知训练方法及系统
申请号:CN202510844861
申请日期:2025-06-23
公开号:CN120930727A
公开日期:2025-11-11
类型:发明专利
摘要
本发明属于大模型训练技术领域,具体涉及一种大模型的分布式量化感知训练方法及系统,包括:获取待训练的大模型的配置参数信息,构建大模型的损失函数,计算梯度范数,得到大模型的一阶梯度信息感知评分;对大模型添加扰动,构建大模型的含扰动损失函数,计算海森矩阵,得到大模型的海森梯度信息感知评分;对所得到的一阶梯度信息感知评分和海森梯度信息感知评分进行自适应加权组合,得到大模型的量化感知评分,确定大模型量化感知训练样本,完成大模型的分布式量化感知训练。本发明结合梯度准则和黑森矩阵,通过自适应加权机制实现大模型的量化感知训练,在实现大模型并行加速训练的同时,提高考虑量化的训练效率和量化效果。
技术关键词
阶梯 模型训练技术 数据并行处理 矩阵 计算机程序产品 训练系统 处理器 样本 平方根 模块 参数 可读存储介质 存储器 软件 元素 电子设备 机制
系统为您推荐了相关专利信息
1
模型的训练、信息推荐方法、装置、电子设备及存储介质
预测点击概率 样本 编码特征 信息推荐方法 关系网络图
2
考虑机组风速限制的风电出力预测方法、装置、设备、介质及产品
风电出力预测方法 集合经验模态分解方法 风速 风电机组 重构
3
一种大气有机物种类识别方法及系统
薛定谔方程 识别方法 正则化参数 离子 矩阵分解算法
4
一种面向自主代客泊车(AVP)场景的轻量化语义点云建图方法
点云地图 相机 泊车 坐标系 矩阵
5
兼顾经济性与电压稳定性的储能装置功率配置方法及系统
功率配置方法 储能装置 储能设备 网损灵敏度 静态电压稳定
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号