摘要
本发明公开了基于有监督对比学习和多任务学习的关系三元组抽取方法,包括以下步骤:S1、获取非结构化文本,将其输入基于Transformer的预训练大模型,生成上下文嵌入表示;S2、基于上下文嵌入表示,应用有监督对比学习结合头尾实体相似度惩罚优化嵌入空间,生成优化后的嵌入表示;S3、将优化后的嵌入表示输入多任务学习框架,集成头实体标注、尾实体标注、关系预测、关系特定头实体标注和关系特定尾实体标注,通过双向预测机制输出结构化三元组。本发明提高关系三元组抽取的准确性,在NYT、NYT*、WebNLG和WebNLG*数据集上,F1分数提升5%‑10%,优于OneRel、TPLinker等模型。
技术关键词
实体
三元组
多任务
关系
生成上下文感知
非结构化文本
标签
序列
样本
表达式
语义
超参数
框架
注意力机制
双线性
分类器
词语
数据