检索模型的训练方法和数据处理方法

AITNT
正文
推荐专利
检索模型的训练方法和数据处理方法
申请号:CN202510005484
申请日期:2025-01-02
公开号:CN119918606A
公开日期:2025-05-02
类型:发明专利
摘要
本申请实施例提供一种检索模型的训练方法和数据处理方法。该检索模型的训练方法包括:获取用于训练检索模型的样本集,样本集包括:多个样本对,每个样本对包括:第一样本和第二样本,第二样本为第一样本的副本,样本集中的样本用于描述业务问题;针对每个样本对,从其他样本对中确定出与样本对的语义相同的目标样本对;将目标样本对与样本对之间的标签进行隐藏处理;根据隐藏处理之后的样本集,对SimCSE模型进行训练,得到检索模型。该方法用以达到无须人工标注参与下且能够训练得到准确的检索模型的效果。
技术关键词
样本 计算机执行指令 语义 数据处理方法 副本 处理器 可读存储介质 数据处理装置 计算机程序产品 模块 训练装置 存储器 标签 电子设备
系统为您推荐了相关专利信息
1
面向动态任务流的异构硬件资源池调度匹配方法、装置、电子设备、存储介质及程序产品
任务调度模型 动态 分布特征 异构 计算机程序指令
2
基于深度学习的图像自适应增强方法及系统
像素点 图像处理平台 图像分析模块 图像处理模块 链路
3
一种AI自动修复视频损坏画面的方法
画面 语义 图像生成模型 时序 运动向量
4
环境敏感型探测器加工环境优化方法及系统
环境敏感型 环境优化方法 探测器 性能预测模型 基准
5
一种针对增益模型的优化方法和时序预测模型
变量 样本 数据 效应 曲线
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号