摘要
本申请实施例提供一种检索模型的训练方法和数据处理方法。该检索模型的训练方法包括:获取用于训练检索模型的样本集,样本集包括:多个样本对,每个样本对包括:第一样本和第二样本,第二样本为第一样本的副本,样本集中的样本用于描述业务问题;针对每个样本对,从其他样本对中确定出与样本对的语义相同的目标样本对;将目标样本对与样本对之间的标签进行隐藏处理;根据隐藏处理之后的样本集,对SimCSE模型进行训练,得到检索模型。该方法用以达到无须人工标注参与下且能够训练得到准确的检索模型的效果。
技术关键词
样本
计算机执行指令
语义
数据处理方法
副本
处理器
可读存储介质
数据处理装置
计算机程序产品
模块
训练装置
存储器
标签
电子设备
系统为您推荐了相关专利信息
任务调度模型
动态
分布特征
异构
计算机程序指令
像素点
图像处理平台
图像分析模块
图像处理模块
链路
环境敏感型
环境优化方法
探测器
性能预测模型
基准