基于大语言模型的少样本关系抽取方法

正文

推荐专利

基于大语言模型的少样本关系抽取方法

申请号：CN202411805368

申请日期：2024-12-10

公开号：CN119646237A

公开日期：2025-03-18

类型：发明专利

摘要

本发明公开了基于大语言模型的少样本关系抽取方法，属于自然语言技术领域。包括有数据集构建、输入与标签生成、损失函数与优化、文本特征提取、关系类型标注、数据标注与质量评分、聚类与样例库构建、获取文档特征并计算相似度、随机采样与筛选、设计提示模板、输出格式设计、模型预测，本技术方案采用了将实体识别和关系分类合并为单一模型的联合抽取方式，联合抽取方法通过共享参数和联合解码来增强子任务间的交互，与传统的先识别实体再判断关系的流水线方案相比，有效减少了误差传播，实现了整体抽取性能的有效提升，此外，联合抽取通过单一模型一次性处理两个子任务，显著减少了关系三元组抽取的训练和预测时间开销，提高了整体抽取效率。

技术关键词

关系抽取方法文档特征三元组大语言模型联合抽取方法自然语言技术格式文本特征向量实体字典数据标签模板聚类算法情景增强子样本列表

基于大语言模型的少样本关系抽取方法

站点导航

APP 下载