面向事件抽取的大语言模型数据增强方法及其装置

AITNT
正文
推荐专利
面向事件抽取的大语言模型数据增强方法及其装置
申请号:CN202411025466
申请日期:2024-07-30
公开号:CN118551194B
公开日期:2024-11-19
类型:发明专利
摘要
本发明提供了一种面向事件抽取的大语言模型数据增强方法及其装置。该方法包括:从初始数据集中获取N个事件模式,事件模式包括事件类别和与事件类别对应的论元角色;基于N个事件模式中的事件类别各自在初始数据集中出现的频率,确定N个事件模式中事件类别各自的采样概率,频率与采样概率成反比;基于N个事件模式中事件类别各自的采样概率,从初始数据集中采样,得到采样数据;将采样数据作为第一上下文提示和提示模板输入大语言模型,输出生成数据,提示模板用于指示大语言模型根据第一上下文提示生成与提示模板关联的生成数据;以及从生成数据中筛选满足预设条件的数据,并存储至初始数据集,得到目标数据集。
技术关键词
大语言模型 三元组 事件触发词 文本 模式 词典 频率 指标 模板结构 采样模块 数据存储
系统为您推荐了相关专利信息
1
一种基于深度学习的牛蛙生物行为识别优化系统
训练图像识别模型 轨迹 理论 周期 构建卷积神经网络
2
一种基于多模态融合网络的多模态情感分析方法
融合特征 情感分析方法 文本 情感分析模型 音频
3
一种安全智能体驱动的安全运营全流程自动化闭环方法及系统
闭环方法 生成提示词 系统日志 关键词提取算法 检查工具
4
黑盒分类交互干预方法、电子设备和存储介质
干预方法 分类网络 瓶颈 矩阵分解方法 样本
5
一种基于水土流失数据的调控方法及系统
植被 调控方法 覆盖率 数字孪生模型 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号