摘要
本申请公开了一种流量数据的快速分类分级方法、系统及介质,主要涉及分类分级技术领域,用以解决现有方案存在只支持结构化数据、对流量数据中的非结构化数据支持不完善、对LLM 依赖性高的问题。包括:采集流量数据对应的文本内容数据;根据文本类型,并行计算数据指纹;基于文本内容数据对应的文本类型,确定数据指纹是否存在于预设指纹缓存区的历史指纹的相似度,当相似度大于预设相似度阈值时,确定历史指纹缓存的分类分级结果为流量数据对应的分类分级结果;当不存在大于预设相似度阈值的历史指纹时,根据文本内容数据和对应的文本类型,并行确定对应的分类分级结果;将分类分级结果和对应的数据指纹缓存至预设指纹缓存区。
技术关键词
分类分级方法
指纹
文本
数据标签
明文
分级系统
非易失性计算机存储介质
命名实体识别技术
分类程序
算法
应用服务器
主题
加解密函数
摘要
语义技术
键值
模块
建模技术