摘要
本发明公开了一种敏感数据识别方法及装置,涉及信息安全技术领域,其中该方法包括:获取多个待处理文件;利用桌面机器人自动化程序对多个待处理文件进行截屏处理,得到多个图片;利用预先构建的文字识别模型识别每个图片中字符信息,得到多个字符串,将每个字符串依次与预设库中参考字符串进行相似度计算,得到每个字符串的类别标识;利用预设规则引擎识别每个字符串中是否包括未脱敏处理的敏感数据;所述预设规则引擎包括对多个类别的敏感数据的识别规则;当识别到任意字符串中包括未脱敏处理的敏感数据,在字符串所属的图片、字符串在所属的图片的位置打印未脱敏处理的标记。本发明可以提高敏感数据识别的通用性。
技术关键词
敏感数据识别方法
桌面机器人
图片
截屏
管理桌面
光学字符识别
标识
创建词汇表
计算机程序产品
脚本
信息安全技术
处理器
可读存储介质
分词
数据获取模块
系统为您推荐了相关专利信息
机器人控制系统
马达
避障模块
深度图数据
碰撞传感器
标志
深度学习图像识别
在线查询服务
移动采集设备
高精度全球定位系统