摘要
本发明公开了一种基于大模型扩展标签增强的信息抽取算法。本发明包括以下步骤:以关系抽取为例,首先使用训练数据集中的文本和相应的头尾实体对来扩展预定义的关系类型;其次使用扩展的关系从验证数据集中的文本中抽取头尾实体对,若抽取的头尾实体对与真实实体对一致则保留相应的扩展关系;最后将保留的扩展关系集成到预定义的关系集合中,利用大模型在测试集上执行关系抽取任务,以此增强模型在关系抽取任务上的性能。本发明适用于利用大模型进行自然语言处理领域的信息抽取任务,通过设计一种基于大模型扩展标签增强的信息抽取算法,证明了大模型在执行信息抽取任务时存在的“虚假关联”现象,并进一步利用扩展类型标签来提升大模型的性能。
技术关键词
抽取算法
事件触发词
关系
跨度
样本
标签
三元组
黄金
文本
生成事件
命名实体识别
指令
比率
自然语言
定义
数据
系统为您推荐了相关专利信息
信令
识别设备
LightGBM模型
识别方法
表格
轮胎
环卫作业车辆
磨损特征
监督学习算法
随机森林模型