一种基于大模型的文本热点聚类方法

正文

推荐专利

一种基于大模型的文本热点聚类方法

申请号：CN202411536287

申请日期：2024-10-31

公开号：CN119474387A

公开日期：2025-02-18

类型：发明专利

摘要

本发明提供了一种基于大模型的文本热点聚类方法，包括：利用大语言模型对待处理文本数据以总结的方式得到文本的摘要输出；基于大语言模型对文本摘要按领域进行划分得到分类标签；基于大语言模型对文本摘要进行要素提取得到要素信息；将文本摘要作为输入使用向量嵌入模型得到语义向量输出；将原始文本属性、文本摘要、分类标签、要素信息和语义向量存入向量库；按照业务需求形成检索条件从向量库中召回文本候选集；根据文本候选集，利用阶段最优聚类算法得到聚类结果，将各类簇的文本摘要集合作为输入，基于大语言模型得到热点摘要总结，整合成为最终热点结果。本发明方法能够提高大规模动态文本数据分析的效率和准确度。

技术关键词

语义向量聚类方法大语言模型摘要热点聚类算法矩阵计算方法字符阶段索引文本编码器标签序列格式数据

系统为您推荐了相关专利信息

基于大模型技术的生物信息分析系统

生物信息分析系统分类边界代表跨模态数据子模块

节点复制

节点存储事务序列呼叫会话控制功能大语言模型

一种多视图自表示与聚类联合优化的深度聚类方法

深度聚类方法样本编码器矩阵拉普拉斯

基于多模块协同优化的智能问答方法及系统

智能问答方法答案问答模型多模块置信度阈值

一种摘要生成方法、装置、计算机设备及存储介质

摘要生成方法深度学习模型线索计算机可读指令摘要生成装置

一种基于大模型的文本热点聚类方法

站点导航

APP 下载