摘要
本申请公开了一种文本聚类方法及计算机可读介质,所述方法包括:对待聚类文本集进行特征提取,得到提问文本特征和回答文本特征;根据提问文本特征和回答文本特征进行投影聚类处理,得到候选提问聚类矩阵和候选回答聚类矩阵;根据候选提问聚类矩阵和候选回答聚类矩阵构建邻接矩阵,并根据邻接矩阵对提问文本特征和回答文本特征进行重构,得到重构提问特征和重构回答特征;根据提问文本特征、回答文本特征、重构提问特征和重构回答特征进行二次投影聚类处理,得到待聚类文本集对应的目标提问聚类结果和目标回答聚类结果。本申请技术方案通过特征重构使得具有相似回答的提问的语义空间会更相近,从而提高了文本聚类的准确性。
技术关键词
文本聚类方法
重构
矩阵
修正误差
元素
计算机
介质
语义
处理器
系统为您推荐了相关专利信息
智能翻译方法
语义关联度
文本
离线
智能翻译系统
MIMO穿墙雷达
多普勒
识别方法
矩阵
穿墙雷达系统