摘要
本发明公开了一种敏感词审核的方法,属于审核领域,包括以下步骤:首先对输入文本进行预处理,如去除空格、符号、停用词等,生成分词结果。接着,构建动态同义词和变形词库,结合用户行为和NLP技术更新,运用词向量模型Word2Vec拓展词义。然后,基于BERT分析文本语境,检测隐喻和双关语。使用静态词库和SVM进行敏感词初筛和二次筛查,LSTM分析复杂语义。基于反馈的自学习机制优化模型,再由人工审核疑难内容并生成分析报告,最后定期更新词库和算法以适应热点。有益效果包括通过自学习机制改进了敏感词审核,能动态更新同义词和变形词库,识别隐晦表达。采用BERT和LSTM模型多层次审核,结合SVM进行二次筛查,提升了对复杂语境和双关语的识别。
技术关键词
Word2Vec模型
同义词
词向量模型
更新词库
文本分析报告
词语
大规模语料库
语义
分词
强化学习技术
训练语言模型
标签
拼音规则
深度学习方法
机器学习方法
审核平台
审核模型
深度神经网络
系统为您推荐了相关专利信息
知识库构建方法
融合知识图谱
个性化知识推荐
大语言模型
保障数据安全
自动化方法
RPA机器人
Word2Vec模型
文本
机器学习模型
识别模型训练方法
教师
学生
长短期记忆网络
文本