摘要
本发明公开了一种基于联邦全局原型的敏感数据识别脱敏方法及系统,包括:终端部署本地模型,对每个实体类别,计算该类别下所有样本数据通过BERT模型提取的文本特征的平均特征作为本地类别原型,与本地模型参数一起上传服务器;服务器聚合本地模型参数进行全局模型参数更新,按实体类别分别聚合本地类别原型进行全局类别原型的更新,下发终端;终端利用更新后的全局模型参数和全局类别原型对CRF层进行增强训练,并计算标签序列;迭代训练得到敏感数据识别模型;进行敏感数据识别和脱敏。本发明中通过构建全局类别原型库,整合多终端的局部特征,结合联邦学习的隐私保护优势和深度学习的建模能力,在保护数据隐私的同时,对敏感数据进行精准识别。
技术关键词
敏感数据识别
脱敏方法
原型
无人巡检
BERT模型
CRF模型
终端
RSA算法生成密钥
文本
实体
参数
保护数据隐私
标签
服务器
输出特征
脱敏系统
接收方
样本
序列
系统为您推荐了相关专利信息
实体识别模型
同义词
LSTM模型
随机方法
双向长短期记忆网络