摘要
本发明涉及数据挖掘技术领域,尤其涉及基于语义信息提取的节点分类聚类方法,包括以下步骤:S1:初始特征向量通过线性变换矩阵投影到向量空间获得第一特征矩阵,根据子图邻接矩阵获得聚合邻接矩阵;S2:第一特征矩阵和聚合邻接矩阵输入多层图卷积网络得到第二特征矩阵;S3:根据语义信息提取函数生成的语义信息矩阵和MLP根据第二特征矩阵提取的语义信息向量,计算差异值,并判断是否完成神经网络的训练;S4:测试集输入到神经网络训练模型,对异构图节点的分类和聚类。本发明通过多层网络层数提取元路径信息,降低了元路径设计因素对下游任务表现效果的影响。且语义信息矩阵和语义信息向量尽可能接近的方式能适应零样本场景下的多种任务。
技术关键词
语义信息提取
聚类方法
节点
线性变换矩阵
多层感知机
神经网络训练
计算机可读指令
异构
生成神经网络
投影变换矩阵
标签
训练集
数据挖掘技术
处理器
计算机设备
单层