URL分类模型的训练方法

AITNT
正文
推荐专利
URL分类模型的训练方法
申请号:CN202411908956
申请日期:2024-12-24
公开号:CN119357676A
公开日期:2025-01-24
类型:发明专利
摘要
本申请提出了一种URL分类模型的训练方法,包括:通过无标记样本URL对第一URL分类模型执行替换令牌检测训练和打乱令牌检测训练得到第二URL分类模型;通过无标记样本URL对第二URL分类模型执行掩码学习、自监督对比学习和虚拟对抗训练,得到第三URL分类模型;基于第一有标记样本URL的编码结果和真实分类标记训练卷积神经网络,使第三URL分类模型与卷积神经网络链接为第四URL分类模型;基于第二有标记样本URL及其真实分类标记,对第四URL分类模型的模型参数进行微调。本技术方案在大幅度降低有标记样本数量的基础上提升URL分类模型对特定URL分类任务的分类能力。
技术关键词
令牌 标记 样本 训练卷积神经网络 序列 计算机可执行指令 参数 编码 字词 优化器 分词 数据 处理器通信 度函数 计算机设备 可读存储介质 符号 存储器
系统为您推荐了相关专利信息
1
一种基于数据血缘的资源需求解析方法及装置
服务组件 随机森林模型 套件 数据 矩阵
2
异常保险数据的识别方法及装置、计算机设备
残差网络 异常对象 文本 标签 样本
3
基于大数据服务的数据智能挖掘系统及方法
编码向量 意图 挖掘方法 智能挖掘系统 序列
4
一种miRNA标志物在诊断与鉴别结核病中的应用
miRNA标志物 引物 荧光染料 序列 试剂盒
5
一种基于大模型的语音多指令并行识别方法及装置
并行识别方法 语音特征 指令 多尺度 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号