摘要
本发明提供了一种基于大模型的文本热点聚类方法,包括:利用大语言模型对待处理文本数据以总结的方式得到文本的摘要输出;基于大语言模型对文本摘要按领域进行划分得到分类标签;基于大语言模型对文本摘要进行要素提取得到要素信息;将文本摘要作为输入使用向量嵌入模型得到语义向量输出;将原始文本属性、文本摘要、分类标签、要素信息和语义向量存入向量库;按照业务需求形成检索条件从向量库中召回文本候选集;根据文本候选集,利用阶段最优聚类算法得到聚类结果,将各类簇的文本摘要集合作为输入,基于大语言模型得到热点摘要总结,整合成为最终热点结果。本发明方法能够提高大规模动态文本数据分析的效率和准确度。
技术关键词
语义向量
聚类方法
大语言模型
摘要
热点
聚类算法
矩阵
计算方法
字符
阶段
索引
文本编码器
标签
序列
格式
数据
系统为您推荐了相关专利信息
生物信息分析系统
分类边界
代表
跨模态数据
子模块
节点
存储事务
序列
呼叫会话控制功能
大语言模型
摘要生成方法
深度学习模型
线索
计算机可读指令
摘要生成装置