摘要
本发明公开了一种基于交织论元关联匹配算法的文档级事件提取方法,涉及自然语言处理领域,包括以下步骤:对文档级事件原始数据进行数据增强,生成增强训练数据集;定义事件类型以及其对应的论元角色,构建结构化事件模板;构建提示模板,结合增强训练数据集对UIE模型进行多任务优化;提取目标文档中的实体、触发词以及论元,生成结构化识别结果;采用交织论元关联匹配算法进行结构重组,生成文档级事件提取结果。该方法通过数据增强、提示模板构建及交织论元关联匹配算法,提升了模型在数据缺乏下的适应性,减少了误差累积,并精准识别跨段落的论元关联,显著提高了文档级事件抽取的准确性和完整性。
技术关键词
事件提取方法
算法
模板
多任务
语义
生成文档
关键字
实体
预训练语言模型
交互式图表
编码器参数
数据
符号
解码器
自然语言
定义
分阶段
三元组
序列
系统为您推荐了相关专利信息
无线接入控制器
无线接入点
光纤链路故障
通信方法
配置网络参数
数据分析系统
半成品菜
数据分析管理
新鲜度
传送带
实时检测方法
工业
表面损伤检测
实时检测系统
通道
分析方法
私钥
高斯混合模型
密码设备
期望最大化算法