一种面向大模型知识库的数据隐私保护方法及系统

正文

推荐专利

申请号：CN202511415683

申请日期：2025-09-29

公开号：CN120893076A

公开日期：2025-11-04

类型：发明专利

摘要

本发明提供一种面向大模型知识库的数据隐私保护方法及系统，涉及人工智能技术领域，所述方法包括：获取各参与方的原始隐私数据，对原始隐私数据进行清洗和特征提取，识别敏感信息字段；利用生成对抗网络对包含敏感信息的字段进行脱敏处理，得到脱敏后的数据；对脱敏后的数据执行k‑匿名化处理，基于准标识符将数据划分为多个等价类，并对记录数量少于k的类进行泛化处理，得到匿名化数据集。本发明解决大模型训练中多参与方数据协同的隐私泄露问题。

技术关键词

数据隐私保护方法模型更新识别敏感信息生成对抗网络拉普拉斯噪声同态加密技术差分隐私机制加密数据标识符服务器数据隐私保护系统字段动态噪声参数生成受保护随机噪声