摘要
本申请提供一种基于混合量化的大模型精调方法及相关设备,包括:步骤确定待训练模型的若干参数矩阵、用于对待训练模型进行训练的若干量化方法和限制条件;根据所述限制条件和若干所述量化方法,对任一所述参数矩阵进行迭代量化,确定任一所述参数矩阵的量化损失值集和显存占用数值集;根据所述量化损失值集和所述显存占用数值集,通过优化方法确定任一所述参数矩阵的最优量化算法;根据若干所述最优量化算法,对所述待训练模型中的若干参数矩阵进行迭代混合量化,确定大模型;通过精调算法对所述大模型的低秩组件的参数进行调整,完成模型精调。
技术关键词
矩阵
算法
参数
精调方法
数值
整数线性规划
精调装置
计算机
处理器
模块
存储器
电子设备
指令
系统为您推荐了相关专利信息
发动机散热风扇
调控方法
控制散热器风扇
负荷预测模型
道路坡度信息
智能数据处理
报告
分析器
气体控制系统
监控等离子体
消毒机器人
DBSCAN算法
感兴趣
参数
点云数据预处理