一种基于大模型逆向生成的文档级关系抽取数据合成方法

正文

推荐专利

申请号：CN202411818564

申请日期：2024-12-11

公开号：CN119782547B

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开一种基于大模型逆向生成的文档级关系抽取数据合成方法，其特点采用采用基于随机游走的知识图谱采样方法，从外部知识图谱中采样主题连贯的子图，并动态调整三元组的采样概率，具体包括：从知识图谱中采样三元组集合、动态调整采样概率、数据增强、基于三元组集合生成对应文档数据和反思修正机制等步骤。本发明与现有技术相比具有无需训练模型，仅依赖于大语言模型本身的推理能力来生成合成数据，确保文档级关系抽取合成数据标签的高准确率和高召回率，提高了数据的可信度，为后续的模型训练提供了坚实的基础，不仅降低了人力成本，还解决了在教育、医疗等特定领域中难以获取足够高质量标注数据的问题，具有良好的运用前景。

技术关键词

三元组实体关系子采样方法大语言模型知识图谱补全方法文本段落数据标签动态更新模板机制频率主题策略

系统为您推荐了相关专利信息

一种用于LED灯珠的封装控制方法及系统

封装控制方法 LED支架随机森林模型灰尘图像

一种基于事件权威影响力计算的流聚类故事生成方法

故事生成方法社交媒体数据挖掘话题模型文本算法

用于专家模型的多模态数据融合方法及系统

数据融合方法知识点模块多模态数据融合文本

基于多传感融合与动态补偿的构件焊接温度测量方法

温度测量方法多传感融合热电堆传感器热力图焊接设备

车辆轨迹预测方法、装置、车辆及存储介质

车辆轨迹预测方法数据路口场景速度计算机程序产品

一种基于大模型逆向生成的文档级关系抽取数据合成方法

站点导航

APP 下载