摘要
本发明提供了一种面向事件抽取的大语言模型数据增强方法及其装置。该方法包括:从初始数据集中获取N个事件模式,事件模式包括事件类别和与事件类别对应的论元角色;基于N个事件模式中的事件类别各自在初始数据集中出现的频率,确定N个事件模式中事件类别各自的采样概率,频率与采样概率成反比;基于N个事件模式中事件类别各自的采样概率,从初始数据集中采样,得到采样数据;将采样数据作为第一上下文提示和提示模板输入大语言模型,输出生成数据,提示模板用于指示大语言模型根据第一上下文提示生成与提示模板关联的生成数据;以及从生成数据中筛选满足预设条件的数据,并存储至初始数据集,得到目标数据集。
技术关键词
大语言模型
三元组
事件触发词
文本
模式
词典
频率
指标
模板结构
采样模块
数据存储
系统为您推荐了相关专利信息
训练图像识别模型
轨迹
理论
周期
构建卷积神经网络
闭环方法
生成提示词
系统日志
关键词提取算法
检查工具