一种数据分类方法、装置、设备、介质及产品

正文

推荐专利

申请号：CN202411706882

申请日期：2024-11-26

公开号：CN119740140A

公开日期：2025-04-01

类型：发明专利

摘要

本公开提供一种数据分类方法，包括获取训练数据集，训练数据集至少包括具有粒度标签的第一数据；基于第一数据的第一参数集，确定待训练模型的粗粒度层级和细粒度层级；基于粗粒度层级、细粒度层级和预设语言模型，构建待训练模型；基于训练数据集，对待训练模型训练，以获取预训练模型；利用预训练模型，对待分类数据进行分类。本公开通过利用具有粗粒度标签的第一数据训练待训练模型，减少了需要模型分类的标签数量，从而降低了待训练模型的模型复杂度，使得待训练模型更容易训练，提高了模型准确度，并在利用预训练模型进行数据分类时，预设语言模型只需根据粒度层级中当前节点对应的节点列表，即可确定待分类数据的类别，提高了数据分类速度。

技术关键词

预训练模型层级数据分类方法语义向量语义特征标签数据分类装置信息熵计算机程序产品处理器节点参数可读存储介质分类器复杂度电子设备

系统为您推荐了相关专利信息

图像搜索方法、装置、电子设备及存储介质

图像搜索方法语义特征标签图像搜索装置指令

一种基于深度学习与激光SLAM的语义地图构建方法

语义地图构建方法语义标签语义分割网络动态物体三维点云数据

知识文档去重方法和知识文档去重装置

文本段落去重方法去重装置大语言模型问答模型

图像路面要素的后处理方法、装置、车辆、存储介质和程序产品

初始轮廓后处理方法路面孔洞特征轮廓

一种大模型辅助的自动化程序验证方法与系统

程序验证方法规模缺陷分析数据变量

一种数据分类方法、装置、设备、介质及产品

站点导航

APP 下载