文档聚类方法及系统、计算机程序产品、电子设备

AITNT
正文
推荐专利
文档聚类方法及系统、计算机程序产品、电子设备
申请号:CN202510401282
申请日期:2025-03-31
公开号:CN120162436A
公开日期:2025-06-17
类型:发明专利
摘要
本申请公开了一种文档聚类方法及系统、计算机程序产品、电子设备。其中,该方法包括:确定待分类的多个目标文档各自的目标摘要向量;基于目标摘要向量对多个目标文档进行聚类,得到多个聚类簇,并确定每个聚类簇对应的主题类型;对于每个聚类簇,确定聚类簇内各个目标文档与其他聚类簇之间的聚类距离,并将聚类距离低于预设的聚类距离阈值的目标文档作为待修正文档;利用第一大语言模型对各个待修正文档重新进行分类,并依据所得的分类结果更新各个聚类簇。本申请解决了相关技术仅依据单一特征对大规模文档进行聚类,导致聚类准确性较差的技术问题。
技术关键词
文档聚类方法 大语言模型 摘要 主题 计算机程序产品 文档聚类系统 段落结构 电子设备 处理器 模块 关键词 存储器
系统为您推荐了相关专利信息
1
一种基于扩散模型的图像生成方法、控制器和存储介质
场景 图像生成方法 计算机可执行指令 分辨率 特征多样化
2
图像分割方法和装置、存储介质和程序产品
图像分割方法 掩膜 机器学习模型 样本 原型
3
一种大语言模型检索增强生成方法和系统
大语言模型 生成方法 标签 答案 参数
4
一种车辆钥匙学习方法、系统、存储介质及产品
车辆钥匙 学习方法 标识 钥匙控制器 关系
5
一种悬吊式随动系统轨迹规划方法及系统
随动系统 轨迹规划方法 悬吊式 模型预测控制算法 航天器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号