一种敏感词审核的方法

正文

推荐专利

一种敏感词审核的方法

申请号：CN202411896258

申请日期：2024-12-23

公开号：CN120068134A

公开日期：2025-05-30

类型：发明专利

摘要

本发明公开了一种敏感词审核的方法，属于审核领域，包括以下步骤：首先对输入文本进行预处理，如去除空格、符号、停用词等，生成分词结果。接着，构建动态同义词和变形词库，结合用户行为和NLP技术更新，运用词向量模型Word2Vec拓展词义。然后，基于BERT分析文本语境，检测隐喻和双关语。使用静态词库和SVM进行敏感词初筛和二次筛查，LSTM分析复杂语义。基于反馈的自学习机制优化模型，再由人工审核疑难内容并生成分析报告，最后定期更新词库和算法以适应热点。有益效果包括通过自学习机制改进了敏感词审核，能动态更新同义词和变形词库，识别隐晦表达。采用BERT和LSTM模型多层次审核，结合SVM进行二次筛查，提升了对复杂语境和双关语的识别。

技术关键词

Word2Vec模型同义词词向量模型更新词库文本分析报告词语大规模语料库语义分词强化学习技术训练语言模型标签拼音规则深度学习方法机器学习方法审核平台审核模型深度神经网络

系统为您推荐了相关专利信息

一种基于发票内商品详情数据提取标准化产品单元的方法

发票语句策略基础同义词

融合知识图谱与大语言模型的幼教领域知识库构建方法

知识库构建方法融合知识图谱个性化知识推荐大语言模型保障数据安全

一种基于图像识别的机器人流程自动化方法

自动化方法 RPA机器人 Word2Vec模型文本机器学习模型

一种轻量级工单业务类型识别模型训练方法、识别方法及装置

识别模型训练方法教师学生长短期记忆网络文本

一种基于大模型的合同单据识别校验方法

识别校验方法语义向量字段单据业务校验

一种敏感词审核的方法

站点导航

APP 下载