摘要
本申请属于数据脱敏技术领域。一种针对敏感数据的全流量数据脱敏方法,方法包括获取所有进出系统的全流量数据,并进行初步数据清洗,得到清洗后的全流量数据;利用正则表达式或机器学习模型对清洗后的全流量数据,进行敏感性识别,得到全流量敏感数据;对全流量敏感数据进行序列化格式转换,并建立索引结构,得到待脱敏数据;利用预先设置的脱敏策略,对待脱敏数据进行脱敏,得到脱敏数据;对脱敏数据,进行分布式存储,得到存储的脱敏数据;利用查询和分析工具,对存储的脱敏数据进行查询和分析,得到用于业务决策的查询和分析结果。上述方法对全流量数据进行实时识别、脱敏处理和序列化存储,能够有效避免敏感信息暴露的风险。
技术关键词
脱敏数据
数据脱敏方法
脱敏策略
进出系统
机器学习模型
分析工具
数据脱敏系统
数据脱敏技术
决策
分布式存储系统
网络流量数据
索引
格式
计算机存储介质
模式匹配
分片
分析单元
存储单元
处理单元
系统为您推荐了相关专利信息
银屑病患者
抗体治疗
差异表达基因
预测装置
机器学习模型
充放电均衡方法
均衡电路
电池管理系统
模糊逻辑控制模块
指数
文档分类器
分类语料库
训练集
关键词
机器学习模型