摘要
一种基于平衡化标签的文档级关系抽取方法,属于自然语言处理领域中的关系抽取领域。本发明实现方法为:收集应用领域的文档数据和领域关注的实体间的关系。基于实体类型和实体在关系语义中的位置,排列组合得到平衡化关系标签加入关系标签集,标注文档数据集实体间存在的关系标签。搭建文档级关系抽取模型,选取基座编码模型,增加三线性池化模块融合主语实体、宾语实体和相关上下文的表示,提高上下文在推理时占的权重。构建改进文档级关系抽取模型训练的损失函数,提高文档级关系抽取模型推理得到的关系标签的置信分数。训练文档级关系抽取模型,选取表现最好的文档级关系抽取模型用于实际应用,提高文档级实体关系抽取的准确率。
技术关键词
关系抽取模型
标签
关系抽取方法
注意力
训练集
表达式
知识图谱构建
语义
矩阵
模块
编码
预训练语言模型
实体关系抽取
参数
构建知识图谱
命名实体识别
自然语言
系统为您推荐了相关专利信息
智能分类方法
BERT模型
文本
卷积神经网络模型
关键词特征
特征提取算法
联合损失函数
权重分配策略
双分支卷积神经网络
可见光图像
动力锂电池
故障预测模型
故障检测方法
故障特征信息
注意力机制