摘要
本发明属于自然语言处理知识图谱领域,具体涉及一种基于大模型的关系三元组抽取方法。获取原始文本信息,以句子为单位进行切分;通过基于预训练语言模型的实体对抽取模型抽取切分后的文本信息的实体对;预定义实体对分类的关系类型,并生成关系三元组抽取任务描述,根据关系类型、任务描述和原始文本信息生成针对大模型的提问模板;根据所述提问模板构建微调数据集,使用微调后的大模型进行关系三元组抽取;通过所述大模型针对抽取的关系三元组做正确性判别,以剔除错误的关系三元组。本发明为三元组抽取领域提供了大小模型结合的统一框架,显著提升大模型三元组抽取效果并为实现关系三元组抽取结果的自动去噪提供了解决方案。
技术关键词
三元组
预训练语言模型
实体
过滤模块
模板
文本
生成关系
存储计算机程序
注意力机制
抽取系统
数据获取模块
自然语言
电子装置
列表
指令
存储器
噪声
系统为您推荐了相关专利信息
行人特征
行人重识别模型
跨模态
可见光
重识别方法
标签管理
模板配置方法
元素
建筑信息模型技术
层级
自动识别方法
命名实体识别模型
文本信息传输
构建知识图谱
生成倒排索引
智能决策方法
三元组损失函数
连续特征数据
度量
措施