面向事件抽取的大语言模型数据增强方法及其装置

正文

推荐专利

申请号：CN202411025466

申请日期：2024-07-30

公开号：CN118551194B

公开日期：2024-11-19

类型：发明专利

摘要

本发明提供了一种面向事件抽取的大语言模型数据增强方法及其装置。该方法包括：从初始数据集中获取N个事件模式，事件模式包括事件类别和与事件类别对应的论元角色；基于N个事件模式中的事件类别各自在初始数据集中出现的频率，确定N个事件模式中事件类别各自的采样概率，频率与采样概率成反比；基于N个事件模式中事件类别各自的采样概率，从初始数据集中采样，得到采样数据；将采样数据作为第一上下文提示和提示模板输入大语言模型，输出生成数据，提示模板用于指示大语言模型根据第一上下文提示生成与提示模板关联的生成数据；以及从生成数据中筛选满足预设条件的数据，并存储至初始数据集，得到目标数据集。

技术关键词

大语言模型三元组事件触发词文本模式词典频率指标模板结构采样模块数据存储

系统为您推荐了相关专利信息

一种基于深度学习的牛蛙生物行为识别优化系统

训练图像识别模型轨迹理论周期构建卷积神经网络

一种基于多模态融合网络的多模态情感分析方法

融合特征情感分析方法文本情感分析模型音频

一种安全智能体驱动的安全运营全流程自动化闭环方法及系统

闭环方法生成提示词系统日志关键词提取算法检查工具

黑盒分类交互干预方法、电子设备和存储介质

干预方法分类网络瓶颈矩阵分解方法样本

一种基于水土流失数据的调控方法及系统

植被调控方法覆盖率数字孪生模型数据

面向事件抽取的大语言模型数据增强方法及其装置

站点导航

APP 下载