摘要
本发明涉及数据管理技术领域,揭露了一种基于自然语言的企业敏感数据脱敏方法及系统,包括:对原始企业数据进行归类处理,得到归类企业数据,对企业文本数据进行字符特征提取,得到文本特征字符,评测文本特征字符对应的字符效用度;标记出文本特征字符中的脱敏特征字符,对脱敏特征字符进行语义模糊化处理,得到模糊特征字符;对图像脱敏区域进行区域模糊处理,得到模糊图像区域;对企业数值数据进行脱敏处理,得到目标数值数据;利用目标数值数据、模糊图像区域及模糊特征字符对归类企业数据进行数据更新处理,得到原始企业数据对应的企业脱敏数据。本发明主要目的在于解决企业敏感数据脱敏灵活性低的问题。
技术关键词
敏感数据脱敏方法
字符
企业
文本
模糊特征
自然语言
图像
信息熵
分词
指标
脱敏数据
敏感数据脱敏系统
数据更新
数据格式
模糊语义
情景
端点
系统为您推荐了相关专利信息
ARIMA模型
供应链需求预测
关系
构建预测模型
节点