基于大语言模型生成思维链解释进行训练的事件抽取方法

AITNT
正文
推荐专利
基于大语言模型生成思维链解释进行训练的事件抽取方法
申请号:CN202410723413
申请日期:2024-06-05
公开号:CN118467737A
公开日期:2024-08-09
类型:发明专利
摘要
本发明公开了一种基于大语言模型生成思维链解释进行训练的事件抽取方法,属于事件抽取技术领域,包括:构建提示语句模板;基于上下文学习方法使用提示语句模板构造输入导入至大语言模型中,生成思维链风格的解释,基于思维链风格的解释生成带解释的数据集;微调小语言模型,通过带解释的数据集对小语言模型进行训练,获得轻量语言模型;对轻量语言模型进行测试,构建复筛模块;将复筛模块和轻量语言模型进行结合,生成事件抽取模型,基于事件抽取模型进行事件抽取。本发明解决了目前事件抽取方法不能对结果进行解释的问题,能够让事件抽取模型拥有输出解释和推理的能力,同时也拥有高于业界主流事件抽取方法的性能。
技术关键词
事件抽取方法 大语言模型 事件抽取技术 生成事件 学习方法 风格 语句 生成符号 标签 模块 解码器 模板 样本 编码器 数据 文本 序列 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号