一种多层级的敏感文本分类方法、系统、终端及存储介质

正文

推荐专利

申请号：CN202510141582

申请日期：2025-02-08

公开号：CN120067331A

公开日期：2025-05-30

类型：发明专利

摘要

本发明公开了一种多层级的敏感文本分类方法、系统、终端及存储介质，所述方法包括：获取历史互联网内容的敏感文本数据，对所述敏感文本数据进行数据清洗，得到目标敏感文本数据，并根据所述目标敏感文本数据构建层级标签数据集；对所述层级标签数据集进行预处理，得到训练数据集，并根据所述训练数据集进行模型训练，得到敏感文本分类模型；获取当前互联网内容的待识别文本数据，将所述待识别文本数据输入至敏感文本分类模型，输出敏感文本分类结果。本发明识别分类覆盖范围广，且细分程度高，还能够识别出文本的含义及代指，同时也能考虑文本的上下文信息，提高分类的精确度，并在处理时所需的资源少，响应速度快。

技术关键词

文本分类方法文本分类模型层级分类程序标签文本分类系统样本模型训练模块可读存储介质数据处理模块处理器终端字符存储器计算机参数表达式序列

系统为您推荐了相关专利信息

口语化语音合成方法、装置、设备及介质

文本声学信号处理标签语音声学特征情感特征

一种信访件自动流转方法、系统及计算机可读介质

自动流转方法文本数据决策可读存储介质

业务数据处理方法、装置、计算机设备和存储介质

指令业务数据处理方法大语言模型标识业务系统

一种完播率高的短视频快速批量成片的方法及系统

热点文本关键词编码时间段

一种酿酒厂包装用酒瓶标签粘贴设备

标签粘贴设备酒瓶带式输送机机架边缘轮廓

一种多层级的敏感文本分类方法、系统、终端及存储介质

站点导航

APP 下载