摘要
本发明公开了一种基于大语言模型的事件论元抽取任务数据合成方法及系统,属于事件论元抽取技术领域,解决现有事件论元抽取任务利用大语言模型合成数据存在事件逻辑断裂、论元分布集中、合成数据样式单一等问题。本发明根据获取的待合成的原始数据中的事件所属的事件类型和对应事件类型所包含的事件论元,确定待合成的原始数据所要包含的论元类型,构建提示词A生成仅包含单个事件的单个句子;构建提示词B生成包含多个事件的段落文本;基于提示词C生成一个单个句子或段落;过滤存在形式问题的结果,并构建提示词D进行标记或添加事件触发词;构建提示词E进行重构;构建提示词F输入大语言模型生成多样化、多风格化的输出;构建提示词G,得到最终的合成数据。本发明用于事件论元抽取。
技术关键词
大语言模型
事件触发词
文本
格式
数据
身份
标记
判断方法
行文风格
正则化方法
机制
核心
重构模块
地点
样式
逻辑
系统为您推荐了相关专利信息
自动生成方法
支持向量机模型
生成规则
语句
数据
指标
企业
加权平均法
机器学习算法
电力系统业务
充放电管理方法
充放电管理系统
车辆
行程
加速度