URL分类模型的训练方法

正文

推荐专利

URL分类模型的训练方法

申请号：CN202411908956

申请日期：2024-12-24

公开号：CN119357676A

公开日期：2025-01-24

类型：发明专利

摘要

本申请提出了一种URL分类模型的训练方法，包括：通过无标记样本URL对第一URL分类模型执行替换令牌检测训练和打乱令牌检测训练得到第二URL分类模型；通过无标记样本URL对第二URL分类模型执行掩码学习、自监督对比学习和虚拟对抗训练，得到第三URL分类模型；基于第一有标记样本URL的编码结果和真实分类标记训练卷积神经网络，使第三URL分类模型与卷积神经网络链接为第四URL分类模型；基于第二有标记样本URL及其真实分类标记，对第四URL分类模型的模型参数进行微调。本技术方案在大幅度降低有标记样本数量的基础上提升URL分类模型对特定URL分类任务的分类能力。

技术关键词

令牌标记样本训练卷积神经网络序列计算机可执行指令参数编码字词优化器分词数据处理器通信度函数计算机设备可读存储介质符号存储器

系统为您推荐了相关专利信息

一种基于数据血缘的资源需求解析方法及装置

服务组件随机森林模型套件数据矩阵

异常保险数据的识别方法及装置、计算机设备

残差网络异常对象文本标签样本

基于大数据服务的数据智能挖掘系统及方法

编码向量意图挖掘方法智能挖掘系统序列

一种miRNA标志物在诊断与鉴别结核病中的应用

miRNA标志物引物荧光染料序列试剂盒

一种基于大模型的语音多指令并行识别方法及装置

并行识别方法语音特征指令多尺度语义

URL分类模型的训练方法

站点导航

APP 下载