摘要
本发明公开了一种多粒度相似性增强的篇章级事件论元抽取方法及系统,属于文本信息抽取领域。本发明首先将文档输入预训练语言模型编码,得到高维度嵌入表示;然后构建包含句子和段落节点的异构图,通过图神经网络融合全局语义信息;最后,通过对比学习和排序损失增强段落和句子粒度的相似性。本发明解决了远距离事件论元抽取的难题,并有效缓解了噪音实体对抽取结果的干扰,提高了抽取的准确性和鲁棒性。
技术关键词
排序损失
预训练语言模型
样本
论元抽取方法
节点
异构
前馈神经网络
融合全局
抽取系统
序列
编码模块
文本
鲁棒性
远距离
邻居
关系
语义