摘要
本申请实施例提供了一种基于词向量模型检测数据合规性的方法及装置,其中,该方法包括:将目标数据输入到目标词向量模型中,得到目标数据的目标词向量;计算目标词向量与违规词库向量空间中的违规词向量之间的余弦相似度,其中,余弦相似度用于表示目标词向量与违规词向量在违规词库向量空间中的相似程度;基于余弦相似度检测目标数据的合规性。通过本申请,解决了相关技术中检测数据合规性的方法存在检测准确率低的问题。
技术关键词
合规性
停用词表
数据
字典
训练词向量模型
词频统计
处理器
可读存储介质
关键词
计算机程序产品
词语
分词
存储器
电子设备