一种基于归因文本的模型训练方法、系统及信息检索方法

正文

推荐专利

申请号：CN202510998368

申请日期：2025-07-21

公开号：CN120509454B

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及人工技术领域，尤其是指一种基于归因文本的模型训练方法、系统及信息检索方法，包括：在原始数据集中提取相关文档集；根据相关文档集生成包含引用的问答对，与该相关文档集构成一个样本；生成多个样本后，计算每个样本的F1分数，将F1分数低于过滤阈值的样本剔除；从原始数据集中随机选取无关文档，加入过滤后的样本的相关文档集中并打乱顺序，并更改引用，得到噪声增强后的样本；以噪声增强后的样本构建训练集对大语言模型进行监督微调，得到完成训练的大语言模型。本发明无需人工标注，能够自动生成高质量的归因文本训练样本。

技术关键词

模型训练方法样本大语言模型归因信息检索方法文本摘要构建训练集模型训练系统噪声自然语言三元组人工技术文档分类关系过滤模块实体标签答案

系统为您推荐了相关专利信息

一种基于融合约束对抗机制的文本分类的方法及系统

编码器随机噪声文本分类模型辅助分类器机制

一种保供电系统异常的预警方法及系统

保供电系统设备状态数据贝叶斯神经网络预警方法复合索引结构

意图识别方法、图像编辑方法、模型训练方法及其装置

图像编辑方法意图识别方法模型训练方法图形用户界面指令

一种船舶多模态数据标签受限下的自适应主动学习方法

主动学习方法多模态数据标签标记决策

一种基于强化学习新颖性感知的商品推荐方法

强化学习模型商品推荐方法特征提取模块历史交互信息交互历史数据

一种基于归因文本的模型训练方法、系统及信息检索方法

站点导航

APP 下载