一种面向量化大语言模型高效微调的低秩矩阵的缩放调节方法及对话生成方法

AITNT
正文
推荐专利
一种面向量化大语言模型高效微调的低秩矩阵的缩放调节方法及对话生成方法
申请号:CN202411037233
申请日期:2024-07-31
公开号:CN119106117A
公开日期:2024-12-10
类型:发明专利
摘要
本发明涉及一种面向量化大语言模型高效微调的低秩矩阵的缩放调节方法及对话生成方法,本发明在权重微调的过程中,对所有的数据会进行逐批次的迭代,迭代过程用以计算前向计算和反向计算,以进行模型优化。且在每次迭代中考虑量化比特宽度带来的影响,避免因为不同比特量化带来的误差导致欠拟合和过拟合问题。同时,在每次迭代中本专利使用和量化网络同粒度的低秩矩阵,这样在量化微调结束后可以保持量化格式的不变。因此解决现有技术中不同量化位宽下低秩矩阵的缩放调节不当等问题,提高了大语言模型微调的性能。
技术关键词
大语言模型 对话生成方法 矩阵 训练语料库 数据 计算机程序产品 处理器 文本 调节系统 分词 指令 超参数 可读存储介质 网络 存储器 格式 标签 误差
系统为您推荐了相关专利信息
1
微电网信息处理方法、装置、计算机设备、可读存储介质和程序产品
微电网系统 状态空间模型 子系统 方程 滑模观测器
2
状态检测方法、装置、电子设备及可读存储介质
加速度 音频特征 全球定位系统数据 电子设备 无线网络参数
3
一种VQE算法中拟设线路最左端激发算符的构造方法
线路 门构造 量子态 算法 CNOT门
4
铲斗的斗齿监测方法、装置、铲斗
监测方法 标签文件 神经网络模型 生成标签 图像处理模块
5
基于大模型的SQL数据集构建方法、装置、电子设备
数据集构建方法 模板 语句 结构化查询语言 电子设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号