摘要
本申请提供了一种微调大语言模型的方法及电子设备;涉及计算机技术领域。该方法包括:在第i个微调阶段,对大语言模型的参数空间进行采样,得到模型参数向量;基于模型参数向量与零阶规模参数,计算阶段损失函数的差分隐私零阶梯度;阶段损失函数为大语言模型的损失函数更新得到;基于差分隐私零阶梯度与学习率,按预设的迭代轮次对大语言模型的模型参数进行迭代处理,得到第i个微调阶段的目标模型参数;本申请实施例,可以降低微调模型的资源消耗,有效保护数据隐私的同时保证模型性能。
技术关键词
差分隐私
大语言模型
阶段
参数
阶梯
规模
表达式
估计算法
保护数据隐私
电子设备
动态剪枝
处理器通信
度函数
噪声
存储器
资源
系统为您推荐了相关专利信息
示教器
机器人
抽象语法树
安全控制模块
信号控制模块
搅拌控制系统
冶金炉窑
深度强化学习
数据采集模块
闭环控制
强化学习环境
泛化方法
决策
识别策略
状态空间模型
切换装置
车辆前方道路
车灯控制器
长短期记忆网络
远近光灯