摘要
本方案公开了一种基于可用性评估的自适应个人信息脱敏方法与系统,包括:接收待脱敏的原数据集并识别隐私字段;为隐私字段制定相应的脱敏策略,且至少两个字段被指定使用泛化算法;对于指定了泛化算法的隐私字段,循环选择其中使相应字段集可用性最高的一个字段进行泛化直至满足K匿名;对于其余隐私字段,根据制定的脱敏策略对相应的隐私字段进行脱敏处理;合并脱敏结果得到脱敏后数据集。本方案提出了使用可用性指标指导K匿名的过程,使得脱敏过程同时关注可用性和隐私性,能够在保证隐私性满足要求的情况下最大程度保证数据集的可用性,使最终输出的脱敏后数据集具有更高的可用性,为后续数据分析的效果提供了一定程度的保障。
技术关键词
可用性评估
泛化算法
脱敏方法
字段
脱敏策略
标识符
敏感信息识别
集成学习器
指标
可用性计算方法
后续数据分析
数据输出模块
数据输入模块
下游机器
脱敏系统
对象
参数
系统为您推荐了相关专利信息
结构化查询语言
语言转换方法
查询意图
模板
关键字
数据传输保障机制
保障方法
环境监测数据
报文
定义