摘要
本发明公开了一种基于NLP提高敏感数据识别率的方法,包括以下步骤:对原始数据进行识别,当未得到识别结果时,启动NLP处理模块对数据进行处理;NLP处理模块对原始数据进行处理,得到处理后的数据;再对NLP处理模块处理后的数据进行二次识别;进行二次识别后输出结果数据。本发明通过优化一般识别流程,对原始数据进行干扰因素过滤、分词、语义分析等处理,加强数据识别过程中对中英文敏感数据的提炼和解析,以提升敏感数据的识别率。
技术关键词
分析组件
分词
数据
语义角色标注
过滤组件
字符
命名方法
文本
功能模块
实体
序列
符号
关系