摘要
本发明提出一种基于最优传输的异配文本属性图节点分类方法及系统,属于图神经网络与自然语言处理领域,本发明针对文本属性图中结构与文本之间存在的多粒度异配的问题,通过融合大规模语言模型、预训练语言模型与图神经网络,提出了一种层次化的结构‑文本对齐机制。具体而言,在细粒度层面,采用一种最大值的平滑近似机制,捕捉文本中关键词与邻居节点之间的双向关键交互关系;在粗粒度层面,引入过滤提示机制以抑制无效或噪声匹配;通过最优传输实现结构与文本分布的柔性对齐。将最优传输匹配作为对比学习的辅助监督信号,引导错误负样本挖掘,缓解文本语义相近但未连接节点之间的表示偏差。本发明提供了结构与文本信息融合与对齐的新方法。
技术关键词
节点分类方法
文本
矩阵
预训练语言模型
邻居
样本
求解算法
分词
机制
分类器
自然语言
集中度
数据
邻域
多层感知机
关键词
分类系统
拼接方式
分类装置