摘要
本申请提供了一种新闻稿件敏感词识别方法、系统、电子设备及存储介质,涉及敏感词识别领域。该方法包括:获取互联网词汇数据并分析得到初始敏感词集合,通过知识图谱构建和知识表示学习算法训练得到敏感词知识图谱,采用多层级敏感词识别和注意力机制的深度神经网络整合得到初步敏感词识别结果。将识别结果映射至敏感词知识图谱并使用图神经网络进行语义表示学习,得到语义表示结果。基于语义表示结果进行关联节点推理得到知识增强的识别结果。最后计算敏感词与上下文的语义相似度得到相似度评分,进行情感倾向分析得到情感评分,结合预设阈值进行综合评估,得到最终敏感词识别结果。通过上述方案提高了新闻稿件敏感词识别的全面性和准确性。
技术关键词
知识图谱构建
节点
语义相关度
情感倾向分析
词识别方法
文本
实体
学习算法
深度神经网络
注意力机制
层级
层次化结构
依存句法分析方法
关系
语义特征
字词
互联网
数据获取模块