摘要
本发明公开了基于区块链和NLP的敏感数据泄露监测与溯源系统及方法,系统包括:数据采集模块用于从多种数据源采集数据;数据预处理模块对采集到的数据增量样本进行预处理;NLP分析模块利用NLP技术对预处理后的数据进行文本预处理、词法分析、句法分析和语义分析,并判断是否存在敏感数据泄露;区块链模块用于存储监测到的泄露事件及增量样本,并实现多节点间的信息传递和共享;分层反馈模块通过分层反馈机制对增量样本进行评估形成评估结果;模型调整模块根据分层反馈模块的评估结果调整自身NLP模型。本发明快速适应复杂多变的敏感数据泄露场景,降低漏报和误报率。
技术关键词
溯源系统
NLP技术
样本
分析模块
分层
数据采集模块
语义
多节点
文本
实时数据监测
联盟链技术
机制
区块链存证
离线
指标
机器学习算法
深度学习模型
溯源方法