摘要
本发明公开了一种多层级的敏感文本分类方法、系统、终端及存储介质,所述方法包括:获取历史互联网内容的敏感文本数据,对所述敏感文本数据进行数据清洗,得到目标敏感文本数据,并根据所述目标敏感文本数据构建层级标签数据集;对所述层级标签数据集进行预处理,得到训练数据集,并根据所述训练数据集进行模型训练,得到敏感文本分类模型;获取当前互联网内容的待识别文本数据,将所述待识别文本数据输入至敏感文本分类模型,输出敏感文本分类结果。本发明识别分类覆盖范围广,且细分程度高,还能够识别出文本的含义及代指,同时也能考虑文本的上下文信息,提高分类的精确度,并在处理时所需的资源少,响应速度快。
技术关键词
文本分类方法
文本分类模型
层级
分类程序
标签
文本分类系统
样本
模型训练模块
可读存储介质
数据处理模块
处理器
终端
字符
存储器
计算机
参数
表达式
序列
系统为您推荐了相关专利信息
指令
业务数据处理方法
大语言模型
标识
业务系统