摘要
本申请公开了一种敏感数据识别方法、装置、电子设备、介质及程序产品,涉及数据安全技术领域,敏感数据识别方法包括:对待识别文本数据进行断句,得到多个短句;统计各短句中不在预设常用词库中的特定词汇,并记录词频在对应的时间驻留矩阵;根据预设的分词规则,对每个短句分别进行分词,确定每个短句对应的多种分词路径;基于各时间驻留矩阵的词频,计算各分词路径分别对应的联合概率,并将联合概率最高的分词路径作为目标分词路径,并对各分词分别进行敏感词检索,得到敏感数据识别结果。本申请的技术方案解决了传统的敏感词匹配算法在处理中文文本时容易发生错误,影响敏感数据识别的准确率的问题。
技术关键词
敏感数据识别方法
分词
马尔可夫模型
矩阵
计算机程序产品
数据安全技术
电子设备
中文文本
处理器
指数
模块
可读存储介质
频率
存储器
专业
系统为您推荐了相关专利信息
农业病虫害识别
注意力方法
深度学习模型
多光谱
通道注意力机制
浮点数乘法
算数逻辑单元
矩阵
元素
数据传输单元
个性化商品
实时数据处理
跨渠道
分析模块
管理方法