摘要
本申请公开了一种查询编码器的训练方法及相关装置,获取前k‑1轮的对话以及第k轮的查询。根据前k‑1轮的对话以及第k轮的查询,通过大语言模型进行重写,得到第k轮的目标重写查询。根据第k轮的目标重写查询,确定前k‑1轮的查询分别与第k轮的目标重写查询的相关性,得到第k轮的目标重写查询对应的历史相关查询和历史无关查询,并确定训练正样本和训练负样本,训练正样本包括目标段落文本和历史相关查询对应的段落文本。根据第k轮的目标重写查询、训练正样本以及训练负样本,通过对比学习对初始查询编码器进行训练,得到查询编码器。由此,通过大语言模型来对查询进行重写,快速获取表达信息完整的查询,更加高效地训练出较为准确的查询编码器。
技术关键词
大语言模型
语义向量
样本
编码器
文本
模版
层次聚类算法
计算机设备
存储计算机程序
训练装置
处理器
存储器
系统为您推荐了相关专利信息
自动化运维方法
故障预测模型
故障特征
风险
参数
减速器组件
关节模组
行星轮组
电机编码器座
连轴
血液生化指标
随机森林模型
多层感知机
诊疗数据
基因
图像块
分割方法
前馈神经网络
图像嵌入
图像编码器