摘要
本发明公开了一种基于自然语言处理的敏感词库构建方法及系统,其包括:获取并预处理含敏感词的文本数据,并通过自然语言处理技术从中获取敏感词,并确定敏感词的特征信息;确定敏感词特征信息对应的主题类型,并按照主题类型对敏感词进行分类,得到敏感词集;确定敏感词集对应主题类型的敏感评估指标,并根据敏感评估指标评估敏感词集对应主题类型的敏感度值;根据敏感度值确定敏感词集的储存区域,将属于相同敏感度值的敏感词集储存到对应的储存区域中,完成敏感词库的构建。本发明通过自然语言处理技术来确定出文本中的敏感词,提高了对敏感词识别的准确度和效率,并通过对敏感词情况全面分析,确定其词库的构建逻辑,以更准确构建出敏感词库。
技术关键词
主题
自然语言
文本
词库构建方法
指标
数据
关键词
标签
关系
语义
构建系统
词特征
社会
分析模块
逻辑
系统为您推荐了相关专利信息
能效评估模型
能效评估方法
历史监测数据
变化关系曲线
综合评价指标
煤矿冲击地压防治
决策方法
指标
BP神经网络
措施
实体识别模型
三元组
知识图谱构建方法
深度学习模型
结构化数据格式
工况参数
热泵系统
压缩机
热泵控制系统
计算机程序指令
电子商务平台
搜索方法
映射关系表
自然语言
语义