模型训练方法、数据处理方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510811763

申请日期：2025-06-17

公开号：CN120705576A

公开日期：2025-09-26

类型：发明专利

摘要

本申请提供了模型训练方法、数据处理方法、装置、设备、存储介质及程序产品；方法包括：通过预先训练的召回模型，确定数据库中的多个候选数据样本相对于第一查询数据样本的召回分数；基于召回分数从多个候选数据样本中确定多个召回数据样本；通过预先训练的排序模型，确定每个召回数据样本相对于第一查询数据样本的排序分数；将召回分数和排序分数融合，得到每个召回数据样本的融合分数；基于召回分数和融合分数，确定第一损失值；基于第一损失值，更新召回模型的参数，得到微调后的召回模型。通过本申请，能够在保持原有召回模型结构简约性与低延迟优势的基础上，提升微调后的召回模型的检索准确性。

技术关键词

样本排序模型模型训练方法数据处理模块计算机可执行指令数据处理方法编码特征关系序列模型训练装置语义参数蒸馏数据处理装置数据获取模块计算机程序产品数值电子设备

模型训练方法、数据处理方法、装置、设备、存储介质及程序产品

站点导航

APP 下载