基于差分隐私机制的大模型训练方法、介质及系统

正文

推荐专利

申请号：CN202510066183

申请日期：2025-01-16

公开号：CN119494408B

公开日期：2025-07-18

类型：发明专利

摘要

本发明公开了一种基于差分隐私机制的大模型训练方法、介质和系统，其中方法包括：S101，获取历史数据，并进行预处理，以及对预处理后的历史数据进行分组和标注，以形成训练数据集；S102，初始化大语言模型参数；S103，基于训练数据集进行训练，并计算梯度；S104，进行梯度加噪，以得到加噪梯度，并基于加噪梯度计算对应的综合不公平性指标值；S105，判断综合不公平性指标值是否处于预设取值范围内；S106，如果综合不公平指标值处于预设取值范围内，则判断当前大语言模型是否满足训练要求；如果是，则将当前大语言模型作为最终模型；如果否，则返回步骤S103。能够实现对用户隐私进行有效保护，同时，避免因使用差分隐私机制而导致的不公平现象的产生。

技术关键词

差分隐私机制模型训练方法大语言模型文本数据噪声强度模型训练系统模块参数指标可读存储介质符号标签因子样本误差程序

系统为您推荐了相关专利信息

显示驱动芯片、显示补偿方法以及显示装置

显示驱动芯片数据图像显示补偿方法显示装置

城市治理数据分类方法、系统、设备及介质

数据分类方法支持向量机训练字段空气质量指数数据分类系统

一种基于智能算法的远程智能物资储运监控方法及系统

智能物资协方差矩阵智能算法动态贝叶斯网络仿真模型

一种矿产地质矿产勘查取样方法

地质矿产勘查取样方法空间分析模块遥感数据处理比例尺

基于数据湖的数据处理方法、装置、系统和存储介质

标签数据处理方法查询数据表解析方法计算机程序指令

基于差分隐私机制的大模型训练方法、介质及系统

站点导航

APP 下载