基于大语言模型生成思维链解释进行训练的事件抽取方法

正文

推荐专利

申请号：CN202410723413

申请日期：2024-06-05

公开号：CN118467737A

公开日期：2024-08-09

类型：发明专利

摘要

本发明公开了一种基于大语言模型生成思维链解释进行训练的事件抽取方法，属于事件抽取技术领域，包括：构建提示语句模板；基于上下文学习方法使用提示语句模板构造输入导入至大语言模型中，生成思维链风格的解释，基于思维链风格的解释生成带解释的数据集；微调小语言模型，通过带解释的数据集对小语言模型进行训练，获得轻量语言模型；对轻量语言模型进行测试，构建复筛模块；将复筛模块和轻量语言模型进行结合，生成事件抽取模型，基于事件抽取模型进行事件抽取。本发明解决了目前事件抽取方法不能对结果进行解释的问题，能够让事件抽取模型拥有输出解释和推理的能力，同时也拥有高于业界主流事件抽取方法的性能。

技术关键词

事件抽取方法大语言模型事件抽取技术生成事件学习方法风格语句生成符号标签模块解码器模板样本编码器数据文本序列矩阵

基于大语言模型生成思维链解释进行训练的事件抽取方法

站点导航

APP 下载