摘要
本发明公开了一种基于差分隐私机制的大模型训练方法、介质和系统,其中方法包括:S101,获取历史数据,并进行预处理,以及对预处理后的历史数据进行分组和标注,以形成训练数据集;S102,初始化大语言模型参数;S103,基于训练数据集进行训练,并计算梯度;S104,进行梯度加噪,以得到加噪梯度,并基于加噪梯度计算对应的综合不公平性指标值;S105,判断综合不公平性指标值是否处于预设取值范围内;S106,如果综合不公平指标值处于预设取值范围内,则判断当前大语言模型是否满足训练要求;如果是,则将当前大语言模型作为最终模型;如果否,则返回步骤S103。能够实现对用户隐私进行有效保护,同时,避免因使用差分隐私机制而导致的不公平现象的产生。
技术关键词
差分隐私机制
模型训练方法
大语言模型
文本
数据
噪声强度
模型训练系统
模块
参数
指标
可读存储介质
符号
标签
因子
样本
误差
程序
系统为您推荐了相关专利信息
数据分类方法
支持向量机训练
字段
空气质量指数
数据分类系统
智能物资
协方差矩阵
智能算法
动态贝叶斯网络
仿真模型
地质矿产勘查
取样方法
空间分析模块
遥感数据处理
比例尺
标签
数据处理方法
查询数据表
解析方法
计算机程序指令