摘要
本公开提供一种数据分类方法,包括获取训练数据集,训练数据集至少包括具有粒度标签的第一数据;基于第一数据的第一参数集,确定待训练模型的粗粒度层级和细粒度层级;基于粗粒度层级、细粒度层级和预设语言模型,构建待训练模型;基于训练数据集,对待训练模型训练,以获取预训练模型;利用预训练模型,对待分类数据进行分类。本公开通过利用具有粗粒度标签的第一数据训练待训练模型,减少了需要模型分类的标签数量,从而降低了待训练模型的模型复杂度,使得待训练模型更容易训练,提高了模型准确度,并在利用预训练模型进行数据分类时,预设语言模型只需根据粒度层级中当前节点对应的节点列表,即可确定待分类数据的类别,提高了数据分类速度。
技术关键词
预训练模型
层级
数据分类方法
语义向量
语义特征
标签
数据分类装置
信息熵
计算机程序产品
处理器
节点
参数
可读存储介质
分类器
复杂度
电子设备
系统为您推荐了相关专利信息
语义地图构建方法
语义标签
语义分割网络
动态物体
三维点云数据
文本段落
去重方法
去重装置
大语言模型
问答模型