一种基于大模型知识蒸馏的文档级事件抽取方法及装置

正文

推荐专利

申请号：CN202510034936

申请日期：2025-01-09

公开号：CN119962515A

公开日期：2025-05-09

类型：发明专利

摘要

本发明提出一种基于大模型知识蒸馏的文档级事件抽取方法，包括：构建训练文档的事件本体信息；基于事件本体信息和大语言模型，构建训练文档的包含上下文信息的事件抽取问题；获取与事件抽取问题匹配的强相关片段；以教师模型基于该强相关片段生成软标签，以软标签构建软标签数据集；构建问答模型，以软标签数据集训练问答模型；以完成训练的问答模型，对目标文档进行事件抽取操作。本发明还提出一种基于大模型知识蒸馏的文档级事件抽取装置。本发明提供一种文档级事件抽取的方法，利用预训练大模型的知识，将其在长文本和复杂事件处理方面的丰富信息迁移到较小的问答模型中，在较少标注数据的情况下，提高事件识别和论元提取的准确率。

技术关键词

事件抽取方法问答模型标签抽取装置计算机可执行指令教师蒸馏 BERT模型事件识别数据答案条目可读存储介质关键词训练集电子设备模块文本编码

系统为您推荐了相关专利信息

一种基于知识蒸馏的视频问答模型及多模态知识蒸馏方法

知识蒸馏方法动作特征问答模型语义特征嵌入特征

一种结合主动学习与自训练的半监督中文地名识别方法

LDA主题模型地名识别方法主动学习方法查询策略文本

基于AI多源融合及视觉补偿的室外热舒适评价系统及方法

热舒适评价深度学习语义分割 XGBoost算法视觉街景

基于图像识别技术的机房巡检方法及其装置

巡检图像机房巡检方法图像识别技术参数主备关系

一种音频处理方法及相关装置

特征提取模型注意力神经网络模型动态贝叶斯网络编码器

一种基于大模型知识蒸馏的文档级事件抽取方法及装置

站点导航

APP 下载