摘要
本发明公开了一种基于Roberta模型的结构化敏感数据识别系统及方法,属于数据处理与信息安全领域。针对传统方法在复杂结构化数据中识别准确率低、泛化能力差的问题,本发明构建了多模态特征融合与联合任务学习架构:通过对Roberta模型进行领域微调,提取文本、数值、日期等多模态特征;设计跨模态特征拼接与多头自注意力机制实现特征增强;构建显式‑隐含敏感数据识别联合任务模型,结合动态Prompt工程实现自适应识别优化。本发明方案能够显著提升了对变形数据、隐含敏感信息的识别能力,在金融、医疗等领域数据集上的F1值均超过98%,有效解决了结构化数据环境下的敏感信息检测与保护难题,满足多行业合规要求。
技术关键词
敏感数据识别系统
子模块
敏感数据识别方法
跨模态融合特征
联合损失函数
特征提取模块
强化学习算法
语义
模态特征
模板
动态
数值
注意力机制
识别模块
文本
多模态
日期
依赖特征