摘要
本发明公开了一种基于多任务学习的文本事件提取方法及系统,其中方法包括:基于训练集文本与预定义事件关键词的语义相似度和统计学特征,构建并更新事件典型关键词词典;基于事件典型关键词词典对训练集文本进行关键词匹配,并标记训练集文本的事件类型;基于参数共享表示与神经堆叠方法构建多任务学习神经网络模型,所述多任务学习神经网络模型包括文本语义表示任务、事件提及检测任务、事件聚类任务、事件摘要任务和事件提取任务;基于损失调和方法与处理后的训练集文本对多任务学习神经网络模型进行训练与优化,再基于训练好的多任务学习神经网络模型提取目标文本中的事件。本发明可解决误差积累和知识不能共享的问题,提高事件提取准确率。
技术关键词
多任务
神经网络模型
事件提取方法
关键词
文本
事件提取系统
训练集
堆叠方法
统计学特征
语义
增量聚类方法
词典
调和方法
典型
种子
摘要
参数
模块
标记