一种文本聚类的方法和装置

AITNT
正文
推荐专利
一种文本聚类的方法和装置
申请号:CN202411035357
申请日期:2024-07-30
公开号:CN118626652A
公开日期:2024-09-10
类型:发明专利
摘要
本发明公开了一种文本聚类的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:分别计算文本集中各个文本之间的编辑距离,得到多个第一文本组及其对应的第一组名;将各个第一文本组对应的第一组名进行分词,得到分词集;分别计算分词集中各个分词的编辑距离,进而根据编辑距离对各个分词进行聚类,得到多个分词组;对于每个分词组,查找出分词组对应的各个第一组名,从分词组对应的各个第一组名中提取出第二组名,并将分词组对应的各个第一组名对应的第一文本组聚合为第二文本组。该实施方式实现了低成本、准确的文本聚类,对表征第一文本组语义的第一组名进行进一步的细粒度分词和聚类,在提升聚类准确性的前提下,减少计算量。
技术关键词
文本 分词 编辑 语义 聚类 深度学习模型 移动电子设备 处理器 存储装置 程序 模块 模板 标识 低成本 计算机 终端 介质 关系
系统为您推荐了相关专利信息
1
基于图增强和LLM微调的Text-to-Cypher语义解析模型生成方法
模型生成方法 三元组 图谱 实体 摘要
2
自动驾驶异常案例挖掘方法、系统、介质和设备
点云 挖掘方法 多模态 语义分割模型 数据
3
一种基于LLM的数据生成方法和装置
样本 流水线 数据生成方法 模板 语义
4
基于指令集优化的伦理审查大模型的构建方法、设备
知识点 大语言模型 指令 数据驱动方法 文本挖掘技术
5
基于大模型的校园智能客服系统及处理方法
答案 大语言模型 校园智能 客服系统 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号