摘要
本发明提供了一种大模型敏感词过滤方法、系统、终端及存储介质,该方法包括:根据敏感词库对待过滤文本进行敏感词匹配,并根据敏感词匹配结果确定所述待过滤文本中的敏感词语句;对所述待过滤文本进行敏感词变体检测,并根据敏感词变体检测结果确定所述待过滤文本中的敏感词变体语句;根据所述敏感词语句和所述敏感词变体语句生成敏感词文本,并将所述敏感词文本输入预训练后的语义大模型进行语义检测,得到敏感文本语义;根据所述敏感文本语义对所述待过滤文本进行敏感词过滤。本发明实施例基于敏感词、敏感词变体和文本语义的组合方式进行敏感词过滤,有效提高了敏感词过滤的准确性。
技术关键词
敏感词过滤方法
文本
检测词汇
语句
字符
词语
敏感词过滤系统
字母
语义库
分词
可读存储介质
处理器
笔画
过滤模块
匹配模块
终端设备
存储器
计算机
机制