摘要
本发明涉及文档级关系抽取技术领域,且公开了融合增强实体与多级表示的文档级关系抽取,预处理的目的是整合多个提及,获得实体的全局表示,对于长度为L的文档D,给定文档表示,其中xt表示位置t处的token(在自然语言处理中,token通常指的是文本中的最小语义单元,例如单词、子词或字符等),为标记实体,使用特殊标记"*"标明实体的起始和结束位置,通过预训练的BERT模型,获取文档D的上下文嵌入向量H。该融合增强实体与多级表示的文档级关系抽取,提出的MFDRE针对DocRE中的长距离依赖问题,提供有效解决方案,MFDRE利用预训练语言模型BERT获取文档内实体的全局表示,融合实体对局部表示与span扩展下的实体对补充表示,显著提升实体节点的表示能力。
技术关键词
节点
注意力
异质
关系抽取技术
邻居
细粒度实体
预训练语言模型
关系抽取模型
线性变换矩阵
自然语言
前馈神经网络
标记
语义
多层次
数据分布
代表
系统为您推荐了相关专利信息
数字孪生模型
自动构建方法
自动识别系统
采样模块
编码