摘要
本发明涉及一种面向量化大语言模型高效微调的低秩矩阵的缩放调节方法及对话生成方法,本发明在权重微调的过程中,对所有的数据会进行逐批次的迭代,迭代过程用以计算前向计算和反向计算,以进行模型优化。且在每次迭代中考虑量化比特宽度带来的影响,避免因为不同比特量化带来的误差导致欠拟合和过拟合问题。同时,在每次迭代中本专利使用和量化网络同粒度的低秩矩阵,这样在量化微调结束后可以保持量化格式的不变。因此解决现有技术中不同量化位宽下低秩矩阵的缩放调节不当等问题,提高了大语言模型微调的性能。
技术关键词
大语言模型
对话生成方法
矩阵
训练语料库
数据
计算机程序产品
处理器
文本
调节系统
分词
指令
超参数
可读存储介质
网络
存储器
格式
标签
误差
系统为您推荐了相关专利信息
微电网系统
状态空间模型
子系统
方程
滑模观测器
加速度
音频特征
全球定位系统数据
电子设备
无线网络参数
监测方法
标签文件
神经网络模型
生成标签
图像处理模块
数据集构建方法
模板
语句
结构化查询语言
电子设备