微调大语言模型的方法及电子设备

AITNT
正文
推荐专利
微调大语言模型的方法及电子设备
申请号:CN202510003176
申请日期:2025-01-02
公开号:CN119398126A
公开日期:2025-02-07
类型:发明专利
摘要
本申请提供了一种微调大语言模型的方法及电子设备;涉及计算机技术领域。该方法包括:在第i个微调阶段,对大语言模型的参数空间进行采样,得到模型参数向量;基于模型参数向量与零阶规模参数,计算阶段损失函数的差分隐私零阶梯度;阶段损失函数为大语言模型的损失函数更新得到;基于差分隐私零阶梯度与学习率,按预设的迭代轮次对大语言模型的模型参数进行迭代处理,得到第i个微调阶段的目标模型参数;本申请实施例,可以降低微调模型的资源消耗,有效保护数据隐私的同时保证模型性能。
技术关键词
差分隐私 大语言模型 阶段 参数 阶梯 规模 表达式 估计算法 保护数据隐私 电子设备 动态剪枝 处理器通信 度函数 噪声 存储器 资源
系统为您推荐了相关专利信息
1
一种通用虚拟示教器系统
示教器 机器人 抽象语法树 安全控制模块 信号控制模块
2
基于WOA增强与可解释AI的锗冶金炉窑智能搅拌控制系统
搅拌控制系统 冶金炉窑 深度强化学习 数据采集模块 闭环控制
3
模型构建方法、信息估计方法、数据集优化及选取方法
电池 热物性参数 充电策略 功率 初始荷电状态
4
一种基于元强化学习的高光谱开放集领域泛化方法
强化学习环境 泛化方法 决策 识别策略 状态空间模型
5
基于模糊神经网络的远近光灯自适应切换装置及其工作方法
切换装置 车辆前方道路 车灯控制器 长短期记忆网络 远近光灯
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号