摘要
本申请公开了一种基于大模型的数据聚类方法、装置、介质及计算机设备,涉及大数据处理及金融科技技术领域。其中方法包括:获取待处理数据,并对待处理数据进行多次随机采样,得到多组样本数据;通过预训练的大模型,对各组样本数据进行聚类处理,得到各组样本数据的多个初始类别名称;通过大模型,对多组样本数据的多个初始类别名称进行降维处理,得到待处理数据的多个目标类别名称;通过多个目标类别名称,逐一对待处理数据中的各个数据进行分类处理,得到待处理数据的聚类结果。上述方法可以避免输入数据超过大模型所支持的最大上下文窗口限制,并且可以降低大模型的计算资源消耗,提升聚类结果的准确性。
技术关键词
数据聚类方法
样本
语义
数据聚类装置
计算机设备
金融科技技术
处理器
数据分类
采样模块
介质
格式
关系