一种基于预训练语言模型的中文事件抽取方法

正文

推荐专利

申请号：CN202410972062

申请日期：2024-07-19

公开号：CN118862875A

公开日期：2024-10-29

类型：发明专利

摘要

本发明涉及事件抽取领域，公开了一种基于预训练语言模型的中文事件抽取方法。首先，本发明提供一种基于预训练语言模型的事件抽取模型的构建方法：将事件抽取任务重新划分，并基于高质量预训练语言模型分别构建句级事件检测模型以及事件元素标注模型；其次，本发明提供一种基于预训练语言模型的事件抽取方法：通过句级事件检测模型对样本进行事件分类、通过事件元素标注模型对样本进行元素标注。本发明能够有效地在中文数据上进行事件抽取，并且通过多阶段数据增强，对当前事件抽取模型构建过程中因数据质量不足导致的过拟合问题进行了优化，提高事件抽取的准确度。

技术关键词

预训练语言模型事件检测模型中文事件抽取方法序列标注模型字符无标签数据编码器元素样本文本模型构建方法命名实体识别分词阶段纠错

系统为您推荐了相关专利信息

基于计算机预测RNA-蛋白质相互作用的方法及系统

神经网络架构拓扑特征序列特征网络模块节点特征

一种基于认证及准入评估的信息处理方法及系统

信息处理方法数据指标字段风险

一种医院药品流转管理方法及系统、电子设备、存储介质

医院药品药品管控管理方法容纳盒卷积神经网络模型

提取CAD中物料清单和标题信息的方法、设备及介质

词典对象序列数据计算机执行指令

识别微电子组装电路字符的方法及装置

混合模块文本识别管壳电路硬件设备

一种基于预训练语言模型的中文事件抽取方法

站点导航

APP 下载