摘要
本申请提供了模型训练方法、数据处理方法、装置、设备、存储介质及程序产品;方法包括:通过预先训练的召回模型,确定数据库中的多个候选数据样本相对于第一查询数据样本的召回分数;基于召回分数从多个候选数据样本中确定多个召回数据样本;通过预先训练的排序模型,确定每个召回数据样本相对于第一查询数据样本的排序分数;将召回分数和排序分数融合,得到每个召回数据样本的融合分数;基于召回分数和融合分数,确定第一损失值;基于第一损失值,更新召回模型的参数,得到微调后的召回模型。通过本申请,能够在保持原有召回模型结构简约性与低延迟优势的基础上,提升微调后的召回模型的检索准确性。
技术关键词
样本
排序模型
模型训练方法
数据处理模块
计算机可执行指令
数据处理方法
编码特征
关系
序列
模型训练装置
语义
参数
蒸馏
数据处理装置
数据获取模块
计算机程序产品
数值
电子设备