面向自然语言短文本的主题聚类处理方法及装置

AITNT
正文
推荐专利
面向自然语言短文本的主题聚类处理方法及装置
申请号:CN202510708574
申请日期:2025-05-29
公开号:CN120578763A
公开日期:2025-09-02
类型:发明专利
摘要
本发明提供了一种面向自然语言短文本的主题聚类处理方法及装置,涉及自然语言处理技术领域,旨在解决现有主题聚类方法时效性和准确性低下,难以满足实际需求的技术问题。该方法包括:获取待处理的自然语言文本,并对自然语言文本进行分词处理;基于分词处理后的自然语言文本,剔除停用词,其中,停用词表征对自然语言文本无贡献语义的词;基于剔除停用词后的自然语言文本,从预先构建的知识图谱中引入关联词对自然语言文本进行语义增强;基于语义增强后的自然语言文本,抽取任意两个关键词进行无序组合,生成二元词组;将二元词组输入预先训练的主题聚类模型进行主题聚类,得到自然语言文本的主题分布。
技术关键词
自然语言文本 主题 面向自然语言 语义 分词 关键词 生成知识图谱 实体消歧 处理器 聚类方法 模块 存储装置 数据 可读存储介质 时效性
系统为您推荐了相关专利信息
1
基因调控网络的预测模型生成方法、装置、服务器和介质
预测模型生成方法 基因调控网络 基因表达特征 矩阵编码器 序列
2
结合组合优化算法与模糊测试的智能参数生成方法
参数生成方法 组合优化算法 变异策略 基础 覆盖率
3
信息获取方法、装置、电子设备及计算机可读存储介质
信息获取方法 图片 标识 图像识别模型 可读存储介质
4
基于语音识别的数字人驱动方法、设备及系统
声音采集设备 声音传播速度 驱动方法 音频 频率
5
基于融合改进胶囊网络与零样本学习的轴承故障诊断方法
胶囊网络 轴承故障诊断方法 小波阈值去噪算法 语义向量 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号