摘要
本说明书实施例公开了一种敏感信息识别方法及装置。所述方法包括:获取待识别文本,并根据规则库中的各条规则对待识别文本的每一数据行进行匹配;在待识别文本中的每一数据行均未命中规则库所存储的规则的情况下,将待识别文本输入至预先训练得到的敏感信息识别模型;敏感信息识别模型包括:特征提取层、分类层、概率输出层,特征提取层用于对所述待识别文本进行分段、以及提取分出的待识别字段的文本向量,分类层用于根据神经网络对各个待识别字段的文本向量进行二分类,概率输出层用于根据激活函数输出待识别文本的敏感概率;在敏感信息识别模型输出的敏感概率超过预设阈值的情况下,确定待识别文本为敏感文本。
技术关键词
敏感信息识别方法
文本
敏感关键词
可执行程序代码
皮尔逊相关系数
双向变换器
分段
训练样本集
存储器
数据
处理器
标识
分析单元
可读存储介质
算法
风险
电子设备
系统为您推荐了相关专利信息
社交网络图
文本识别
深度特征提取
语义依存分析
风险识别方法