基于人工智能的敏感词精确过滤方法

正文

推荐专利

基于人工智能的敏感词精确过滤方法

申请号：CN202411101287

申请日期：2024-08-12

公开号：CN119106131B

公开日期：2025-04-15

类型：发明专利

摘要

本发明涉及文本处理技术领域，具体涉及基于人工智能的敏感词精确过滤方法，该方法包括：采集待过滤目标文本句子；使用正则表达式和中文分词工具获取各目标文本句子的词汇序列，并获取所有目标文本句子的疑似敏感词集合，进而获取各目标文本句子的书写合理性；根据BERT模型获取各目标文本句子的情感分数；根据FastText模型获取疑似敏感词和敏感词词典中词汇之间的语义相关性，并获取目标文本句子中各敏感词的语义脱敏度，进而获取各目标文本句子的语义脱敏度；计算各目标文本句子的潜在敏感指数，进而对目标文本句子进行过滤。本发明旨在解决由于考虑目标文本句子的特征太少从而导致过滤结果较差的问题。

技术关键词

情感分析模型过滤方法中文分词工具 BERT模型词典指数序列语义向量文本处理技术 LSTM模型标签频率

系统为您推荐了相关专利信息

一种基于元学习及语言对子网的多语言神经机器翻译模型训练方法

机器翻译模型多语言掩码矩阵参数元学习方法

基于多源数据分析的智慧工地安全管控方法及系统

视觉特征管控方法智慧工地支路文本

一种中医古籍文本数据指代消解方法、设备、介质

指代消解方法 BiLSTM模型 BERT模型文本标注规则

一种基于Seq2Seq和DBSCAN的古诗词语义检索方法

语义检索方法动态滑动窗口 Word2Vec模型语句特征向量库

基于大语言模型的专利风险评估方法

风险评估方法大语言模型图片数据图像处理模块

基于人工智能的敏感词精确过滤方法

站点导航

APP 下载