一种基于大模型的文本热点聚类方法

AITNT
正文
推荐专利
一种基于大模型的文本热点聚类方法
申请号:CN202411536287
申请日期:2024-10-31
公开号:CN119474387A
公开日期:2025-02-18
类型:发明专利
摘要
本发明提供了一种基于大模型的文本热点聚类方法,包括:利用大语言模型对待处理文本数据以总结的方式得到文本的摘要输出;基于大语言模型对文本摘要按领域进行划分得到分类标签;基于大语言模型对文本摘要进行要素提取得到要素信息;将文本摘要作为输入使用向量嵌入模型得到语义向量输出;将原始文本属性、文本摘要、分类标签、要素信息和语义向量存入向量库;按照业务需求形成检索条件从向量库中召回文本候选集;根据文本候选集,利用阶段最优聚类算法得到聚类结果,将各类簇的文本摘要集合作为输入,基于大语言模型得到热点摘要总结,整合成为最终热点结果。本发明方法能够提高大规模动态文本数据分析的效率和准确度。
技术关键词
语义向量 聚类方法 大语言模型 摘要 热点 聚类算法 矩阵 计算方法 字符 阶段 索引 文本编码器 标签 序列 格式 数据
系统为您推荐了相关专利信息
1
基于大模型技术的生物信息分析系统
生物信息分析系统 分类边界 代表 跨模态数据 子模块
2
节点复制
节点 存储事务 序列 呼叫会话控制功能 大语言模型
3
一种多视图自表示与聚类联合优化的深度聚类方法
深度聚类方法 样本 编码器 矩阵 拉普拉斯
4
基于多模块协同优化的智能问答方法及系统
智能问答方法 答案 问答模型 多模块 置信度阈值
5
一种摘要生成方法、装置、计算机设备及存储介质
摘要生成方法 深度学习模型 线索 计算机可读指令 摘要生成装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号