摘要
本申请提出一种文档级关系抽取方法,属于自然语言处理技术领域,方法包括:对文档中所有实体两两排列形成实体对;将每一个实体对输入预训练的关系抽取模型,基于实体的上下文信息和语义特征进行聚类构建实体特征簇,基于众证投票机制得到支持实体关系的多个证明句子;在证明句子中,计算实体对中每一个实体下所有提及的注意力得分总和;计算得到实体对的实体关系得分,将实体关系得分最高的一个或多个实体关系作为关系抽取结果。本申请的实体表示不仅能够更准确地建模实体之间的语义信息,还能确保不同特征簇之间的实体表示具有明显差异,从而增强关系抽取的效果和模型的整体性能,提高了文档级关系抽取的准确性。
技术关键词
关系抽取方法
关系抽取模型
注意力
细粒度实体
双线性
预测特征
预训练语言模型
分类器
实体间关系
聚类
参数
语义特征
自然语言
索引
文本
编码
系统为您推荐了相关专利信息
病理图像分割方法
卷积特征
网络特征
交互特征
融合特征
三维实景模型
矿山岩体
矿山智能爆破管理系统
岩体模型
决策
场效应管筛选方法
时域特征
电气
离散小波变换
随机森林
卫星云图
多通道
采样模块
输出特征
模型训练模块