摘要
本发明涉及事件抽取领域,公开了一种基于知识蒸馏技术的中文事件抽取方法。首先,本发明提供一种基于知识蒸馏技术的事件抽取模型的构建方法:基于高质量预训练语言模型构建教师模型,基于轻量级未预训练语言模型构建学生模型,通过离线蒸馏的方式将教师模型蒸馏到学生模型上以提升学生模型的预测表现;其次,本发明提供一种基于所述模型的事件抽取方法:通过事件检测子模型对触发词与事件类别进行识别与分类,通过事件参数抽取子模型对每个事件类别对应的事件参数进行识别与分类。本发明能够有效地在中文数据上进行事件抽取,并通过知识蒸馏技术提升算法构建的灵活性以及算法预测的有效性。
技术关键词
知识蒸馏技术
预训练语言模型
序列标注模型
中文事件抽取方法
事件触发词
教师
字符
事件检测模型
学生
抽取算法
参数
预测类别
编码器
文本
样本
模型构建方法
系统为您推荐了相关专利信息
缺陷检测方法
激光位移传感器
高光谱相机
缺陷类别
交叉注意力机制
深度卷积生成对抗网络
注意力机制
覆盖率
喷丸表面
图像获取模块