摘要
本发明涉及事件抽取领域,公开了一种基于预训练语言模型的中文事件抽取方法。首先,本发明提供一种基于预训练语言模型的事件抽取模型的构建方法:将事件抽取任务重新划分,并基于高质量预训练语言模型分别构建句级事件检测模型以及事件元素标注模型;其次,本发明提供一种基于预训练语言模型的事件抽取方法:通过句级事件检测模型对样本进行事件分类、通过事件元素标注模型对样本进行元素标注。本发明能够有效地在中文数据上进行事件抽取,并且通过多阶段数据增强,对当前事件抽取模型构建过程中因数据质量不足导致的过拟合问题进行了优化,提高事件抽取的准确度。
技术关键词
预训练语言模型
事件检测模型
中文事件抽取方法
序列标注模型
字符
无标签数据
编码器
元素
样本
文本
模型构建方法
命名实体识别
分词
阶段
纠错
系统为您推荐了相关专利信息
神经网络架构
拓扑特征
序列特征
网络模块
节点特征
医院药品
药品管控
管理方法
容纳盒
卷积神经网络模型