摘要
本发明具体来说是一种基于领域知识与多粒度图网络的文档摘要方法,包括:S1构建知识编码模块,进行领域知识图谱迁移学习,结合胶囊网络提取三元组结构特征,生成文本实体编码模块;S2构建知识融合模块,将文档文本转化为语义向量,将语义向量与外部知识自适应融合;S3构建词级语义图,通过语义图注意力机制聚合邻域信息,得到含上下文的词嵌入表示;S4构建句级语义图,对S3中的词级语义向量进行自注意力计算,得到句级语义向量的语义结点表示,对句级结点进行特征聚合,得到文档的全局语义信息;S5构建输出层,根据S4中的文档特征向量预测得到最终的抽取式摘要结果。本发明优点在于:去除文档中的冗余信息,消除文本语义的歧义性。
技术关键词
语义向量
文档摘要方法
结点
三元组
胶囊网络
知识图谱链接预测
编码模块
注意力机制
动态切片
拓扑结构信息
预训练语言模型
命名实体识别
文本
系统为您推荐了相关专利信息
智能识别方法
深度神经网络模型
度量
交叉点
拓扑图