摘要
本发明实施例涉及一种以大语言模型为编码器的文档检索方法和装置,所述方法包括:选择一款已经完成预训练且能一次性处理K级上下文的大语言模型作为查询、文档、联合编码器;以查询、文档编码器为核心构建相似性评分模型,以联合编码器为核心构建相关性评分模型,并进行模型训练;训练结束后,根据用户输入的查询文本和相似性评分模型对用户指定的文档库进行文档初选,并根据用户输入的查询文本和相关性评分模型对初选文档序列进行文档终选得到终选文档序列向当前用户反馈。本发明可以提升检索准确度。
技术关键词
文档检索方法
编码器
文本
优化器
大语言模型
序列
编码向量
分词
样本
标签
数据
处理单元
语义特征提取
输入端
模式
矩阵
参数
模型训练模块
索引
系统为您推荐了相关专利信息
风险评估模型
综合风险评估方法
构建卷积神经网络
多模态
残差模块
语义特征
图像分割模型
多模态特征融合
矩阵
图像像素