摘要
本发明涉及数据安全技术领域,特别涉及一种敏感数据自动识别方法、系统、介质及电子设备,所述的敏感数据自动识别方法通过获取相关数据表的数据,对数据表进行初步筛选和实体识别;针对不同实体类型,提取相应特征并构建基础兜底模型,采用规则方法计算初始敏感等级;结合人工标注优化训练样本,使用决策树算法构建改进模型,并通过改进模型确定数据表的最终敏感等级。有效解决了传统方法在大规模数据中识别敏感信息的效率和准确性问题,降低敏感信息泄漏风险,实现了敏感数据的智能化、自动化识别。
技术关键词
实体
组织
特征工程
关键字
标识
决策树算法
敏感数据自动识别
基础
不动产登记信息
预警规则
识别敏感信息
数据安全技术
日志
规则方法
电子设备
处理器
可读存储介质
数据获取模块