摘要
本申请提供一种根据用户问题召回军事文档的对比学习训练方法及系统。方法包括:对文档数据进行预处理,提取文档关键词,生成文档特征;对输入问题提取查询关键词,生成查询特征;基于输入问题,构建正样本对和负样本对,正样本对包括输入问题和对应的正样本,负样本对包括输入问题和对应的负样本;利用双塔模型分别处理查询特征和文档特征,生成查询特征向量和文档特征向量;计算查询特征向量和文档特征向量的相似度,为正样本和负样本分配相似度标签;对负样本进行软挖掘和硬挖掘处理;利用动量对比机制和负样本队列,增大对比学习的批量大小。本申请可以提高处理效率和召回准确性。
技术关键词
学习训练方法
样本
文档关键词
查询特征
查询关键词
生成文档
文档特征
编码器
军事
学习训练系统
表达式
机制
队列
标签
数据
批量
预训练模型
模块
计算机