摘要
本申请公开了一种敏感词过滤方法及相关装置,涉及自然语言处理技术领域,包括:预先构建包括多个敏感词片段对应的向量的敏感词片段向量知识库;在获取待处理的文本之后,先得到文本对应的向量,由于每个敏感词片段对应的向量用于表征敏感词片段的语义信息,每个敏感词片段中包括至少一个敏感词;文本对应的向量用于表征文本的语义信息,后续至少利用文本对应的向量与敏感词片段向量知识库中各敏感词片段对应的向量的匹配度,确定文本中待处理的敏感词片段,以及每个待处理的敏感词片段的敏感等级;并基于各个待处理的敏感词片段的敏感等级,对待处理的文本进行敏感词过滤处理,能够实现语义理解的利用,进而能够提升敏感词过滤的效果。
技术关键词
敏感词过滤方法
文本
白名单
计算机可读指令
电子设备
语义
存储计算机程序
处理单元
计算机程序产品
策略
自然语言
处理器
对象
可读存储介质
存储器
系统为您推荐了相关专利信息
java虚拟机
加载器
模块
识别方法
计算机可读指令
设施
启发式算法
训练样本数据
地点
随机梯度下降