摘要
本发明公开了基于大语言模型的少样本关系抽取方法,属于自然语言技术领域。包括有数据集构建、输入与标签生成、损失函数与优化、文本特征提取、关系类型标注、数据标注与质量评分、聚类与样例库构建、获取文档特征并计算相似度、随机采样与筛选、设计提示模板、输出格式设计、模型预测,本技术方案采用了将实体识别和关系分类合并为单一模型的联合抽取方式,联合抽取方法通过共享参数和联合解码来增强子任务间的交互,与传统的先识别实体再判断关系的流水线方案相比,有效减少了误差传播,实现了整体抽取性能的有效提升,此外,联合抽取通过单一模型一次性处理两个子任务,显著减少了关系三元组抽取的训练和预测时间开销,提高了整体抽取效率。
技术关键词
关系抽取方法
文档特征
三元组
大语言模型
联合抽取方法
自然语言技术
格式
文本特征向量
实体
字典
数据
标签
模板
聚类算法
情景
增强子
样本
列表