摘要
本发明涉及基于事件预训练的跨境民族文化事件抽取方法及装置,属于自然语言处理技术领域。针对跨境民族文化领域事件要素之间存在并列、从属等关系,导致事件要素难以分类的问题,本发明提出了基于事件预训练的跨境民族文化事件抽取方法,主要包括跨境民族文化事件抽取数据集构建、跨境民族文化事件结构图构建、基于事件预训练的跨境民族文化事件抽取模型以及跨境民族文化事件抽取四个部分构成。根据这四个部分功能模块化制成基于事件预训练的跨境民族文化事件抽取装置,对跨境民族文化事件进行抽取,本发明解决了跨境民族文化事件抽取中要素关系复杂导致事件难以分类的问题。
技术关键词
事件抽取方法
语义依存分析
文本编码器
预训练语言模型
标注工具
抽取装置
学习方法
节点
数据
命名实体识别
饮食制作
关系
维基百科
词典
分词
自然语言