微调大语言模型的方法及电子设备

正文

推荐专利

微调大语言模型的方法及电子设备

申请号：CN202510003176

申请日期：2025-01-02

公开号：CN119398126A

公开日期：2025-02-07

类型：发明专利

摘要

本申请提供了一种微调大语言模型的方法及电子设备；涉及计算机技术领域。该方法包括：在第i个微调阶段，对大语言模型的参数空间进行采样，得到模型参数向量；基于模型参数向量与零阶规模参数，计算阶段损失函数的差分隐私零阶梯度；阶段损失函数为大语言模型的损失函数更新得到；基于差分隐私零阶梯度与学习率，按预设的迭代轮次对大语言模型的模型参数进行迭代处理，得到第i个微调阶段的目标模型参数；本申请实施例，可以降低微调模型的资源消耗，有效保护数据隐私的同时保证模型性能。

技术关键词

差分隐私大语言模型阶段参数阶梯规模表达式估计算法保护数据隐私电子设备动态剪枝处理器通信度函数噪声存储器资源

系统为您推荐了相关专利信息

一种通用虚拟示教器系统

示教器机器人抽象语法树安全控制模块信号控制模块

基于WOA增强与可解释AI的锗冶金炉窑智能搅拌控制系统

搅拌控制系统冶金炉窑深度强化学习数据采集模块闭环控制

模型构建方法、信息估计方法、数据集优化及选取方法

电池热物性参数充电策略功率初始荷电状态

一种基于元强化学习的高光谱开放集领域泛化方法

强化学习环境泛化方法决策识别策略状态空间模型

基于模糊神经网络的远近光灯自适应切换装置及其工作方法

切换装置车辆前方道路车灯控制器长短期记忆网络远近光灯

微调大语言模型的方法及电子设备

站点导航

APP 下载