摘要
本发明实施例涉及一种基于大语言模型进行关系抽取的处理方法和装置,所述方法包括:选择大语言模型作为第一模型;通过人工/机器模型的数据采集/清洗/标注方式构建第一数据集对第一模型的关系抽取/验证功能进行预训练;预训练结束后基于第一模型的文本生成功能构建第二数据集,并基于第一模型的关系验证功能对第二数据集进行数据清洗,并基于清洗后的第二数据集对第一模型的关系抽取功能进行微调;微调结束后将用户输入的第查询文本、限定关系序列和输出格式带入第一指令模板进行大模型输入文本组装,并将组装文本输入第一模型进行关系三元组识别与筛选处理得到输出文本向用户反馈。通过本发明可以增强模型泛化性、提高预测准确度。
技术关键词
三元组
文本
关系
大语言模型
实体
优化器
参数
序列
模板
标记
基准标签
指令
格式化
模型预训练
脚本
收发器
数据采集方式
系统为您推荐了相关专利信息
知识问答方法
自然语言
环境状态预测
生成对抗网络
空间聚类算法
客户风险识别方法
照片
图谱
文本特征向量
图像特征向量
课件内容
页面结构
自动生成方法
大语言模型
教育场景
意图
终端设备
智能体平台
数据处理装置
数据处理方法