一种重排序模型的数据集构建及评分方法

正文

推荐专利

一种重排序模型的数据集构建及评分方法

申请号：CN202510688568

申请日期：2025-05-26

公开号：CN120653731A

公开日期：2025-09-16

类型：发明专利

摘要

本申请涉及属于数据检索与处理技术领域，本申请提供一种重排序模型的数据集构建及评分方法，步骤包括：数据源选择与预处理，从多场景数据源收集查询文档对并生成嵌入向量，构建数据集；大语言模型评分，通过结构化提示词调用大语言模型对查询文档对进行评分；多模型评分交叉验证，采用多个大语言模型独立评分及动态一致性检验机制确定最终评分；重排序模型档内校准，在大语言模型评分的基础上利用重排序模型优化最终评分；数据集评估与调整，分析评分分布及文本长度分布，通过欠采样与过采样调整数据分布以满足训练需求。本申请通过多源数据融合、多模型协同评分及动态校准机制，达到提升文档相关性评分准确性和增强模型泛化能力。

技术关键词

排序模型评分方法大语言模型样本多模型协同数据分布生成数据源校准机制文本档位场景动态多语言异常状态模式格式

系统为您推荐了相关专利信息

一种风机覆冰功率的损失处理方法及装置

动态预测模型气象环境参数覆冰多参数超参数

一种基于实验和机器学习的粉土生物矿化抑尘方法

生物矿化抑尘方法抑尘剂机器学习模型构建预测模型

一种MySQL实例磁盘风险预警方法、装置及电子设备

随机森林磁盘操作训练样本数据风险预警方法数据特征提取

一种唇语识别方法、装置、设备、介质及产品

唇语识别方法文本图像训练样本集序列

工业时间序列的模糊动态推理方法、装置及设备

动态推理方法工业设备模糊逻辑模糊隶属度计算机执行指令

一种重排序模型的数据集构建及评分方法

站点导航

APP 下载