摘要
本发明公开了基于大语言模型的层级分类方法、电子设备及计算机可读存储介质,基于大语言模型实现,包括以下步骤:步骤S1、文本采样:准备待分析的文本数据集合,然后进行文本采样,从文本数据集合中得到一个冷启动文本集合以及一个后续文本集合;步骤S2、冷启动:基于冷启动文本集合进行批量聚类分析,输出冷启动文本集合中每条文本对应的类别信息集合,并同时输出一个层级标签体系;步骤S3、流式处理:基于冷启动中得到的层级标签体系对后续文本集合中的文本进行分类,得到后续文本集合中所有文本对应的分类结果。本发明具有节省人工观察工作量,可以准确聚类,提升文本数据的统计分析效率和效果等优点。
技术关键词
层级分类方法
大语言模型
文本
标签体系
可读存储介质
聚类算法
词嵌入模型
电子设备
处理器
计算机
存储装置
数据
批量
程序
工作量
样本
编码
系统为您推荐了相关专利信息
轮廓特征
轮廓信息
轮廓识别
语义分割模型训练
样本
诊断胰腺导管腺癌
生物标记物
多元统计模型
患者
产酸丙酸杆菌
故障预警方法
风机轴承
振动特征
诊断风机故障
频域特征
遥感图像识别方法
预训练模型
视觉
遥感图像数据
文本编码器