摘要
本发明公开了一种用于经济大数据的数据文本脱敏方法及系统,具体涉及文本脱敏领域,本发明在数据接收阶段,通过多通道接入异构数据源,对结构化数据进行字段级标准化处理,对非结构化文本采用OCR转换和语义分割,并构建数据血缘关系图谱,基于预训练NER模型识别敏感实体,结合动态权重计算实现三层分级管理,将实体划分为核心层、关联层和非敏感层;通过知识图谱技术构建实体关联网络,量化隐私关联强度系数,实现跨实体脱敏一致性控制;再采用隐私风险评估模型计算残余风险值,当超过阈值时触发自适应增强机制,在保护隐私的同时通过效用评估单元维持数据可用性,形成风险与效用的动态平衡。
技术关键词
脱敏方法
实体
大数据
风险评估模型
计算方法
语义
非结构化文本
统计特征
标识符
脱敏策略
反馈控制循环
隐私风险评估
拓扑图
异构信息网络
数据血缘关系
关系抽取模型
系统为您推荐了相关专利信息
数学主观题解答
训练语言模型
知识点
图谱
语义关联度
人机交互模块
风险评估模型
系统性红斑狼疮
支撑定位机构
患者