摘要
本发明提供了一种大模型敏感词过滤方法、系统、终端及存储介质,该方法包括:根据敏感词库对待过滤文本进行敏感词匹配,并根据敏感词匹配结果确定所述待过滤文本中的敏感词语句;对所述待过滤文本进行敏感词变体检测,并根据敏感词变体检测结果确定所述待过滤文本中的敏感词变体语句;根据所述敏感词语句和所述敏感词变体语句生成敏感词文本,并将所述敏感词文本输入预训练后的语义大模型进行语义检测,得到敏感文本语义;根据所述敏感文本语义对所述待过滤文本进行敏感词过滤。本发明实施例基于敏感词、敏感词变体和文本语义的组合方式进行敏感词过滤,有效提高了敏感词过滤的准确性。
技术关键词
敏感词过滤方法
文本
检测词汇
语句
字符
词语
敏感词过滤系统
字母
语义库
分词
可读存储介质
处理器
笔画
过滤模块
匹配模块
终端设备
存储器
计算机
机制
系统为您推荐了相关专利信息
医疗数据处理方法
项目
训练预测模型
文本
训练样本数据
板件组合
入库方法
打印图像数据
家具板件
电子标签
健康信息管理系统
饮食健康
文本分类算法
运动健康
意图识别