基于大模型的数据聚类方法、装置、介质及计算机设备

正文

推荐专利

申请号：CN202411571523

申请日期：2024-11-05

公开号：CN119474923A

公开日期：2025-02-18

类型：发明专利

摘要

本申请公开了一种基于大模型的数据聚类方法、装置、介质及计算机设备，涉及大数据处理及金融科技技术领域。其中方法包括：获取待处理数据，并对待处理数据进行多次随机采样，得到多组样本数据；通过预训练的大模型，对各组样本数据进行聚类处理，得到各组样本数据的多个初始类别名称；通过大模型，对多组样本数据的多个初始类别名称进行降维处理，得到待处理数据的多个目标类别名称；通过多个目标类别名称，逐一对待处理数据中的各个数据进行分类处理，得到待处理数据的聚类结果。上述方法可以避免输入数据超过大模型所支持的最大上下文窗口限制，并且可以降低大模型的计算资源消耗，提升聚类结果的准确性。

技术关键词

数据聚类方法样本语义数据聚类装置计算机设备金融科技技术处理器数据分类采样模块介质格式关系

基于大模型的数据聚类方法、装置、介质及计算机设备

站点导航

APP 下载