摘要
本申请公开了一种文档聚类方法及系统、计算机程序产品、电子设备。其中,该方法包括:确定待分类的多个目标文档各自的目标摘要向量;基于目标摘要向量对多个目标文档进行聚类,得到多个聚类簇,并确定每个聚类簇对应的主题类型;对于每个聚类簇,确定聚类簇内各个目标文档与其他聚类簇之间的聚类距离,并将聚类距离低于预设的聚类距离阈值的目标文档作为待修正文档;利用第一大语言模型对各个待修正文档重新进行分类,并依据所得的分类结果更新各个聚类簇。本申请解决了相关技术仅依据单一特征对大规模文档进行聚类,导致聚类准确性较差的技术问题。
技术关键词
文档聚类方法
大语言模型
摘要
主题
计算机程序产品
文档聚类系统
段落结构
电子设备
处理器
模块
关键词
存储器
系统为您推荐了相关专利信息
场景
图像生成方法
计算机可执行指令
分辨率
特征多样化
随动系统
轨迹规划方法
悬吊式
模型预测控制算法
航天器