一种以大语言模型为编码器的文档检索方法和装置

正文

推荐专利

申请号：CN202510459931

申请日期：2025-04-14

公开号：CN120407782A

公开日期：2025-08-01

类型：发明专利

摘要

本发明实施例涉及一种以大语言模型为编码器的文档检索方法和装置，所述方法包括：选择一款已经完成预训练且能一次性处理K级上下文的大语言模型作为查询、文档、联合编码器；以查询、文档编码器为核心构建相似性评分模型，以联合编码器为核心构建相关性评分模型，并进行模型训练；训练结束后，根据用户输入的查询文本和相似性评分模型对用户指定的文档库进行文档初选，并根据用户输入的查询文本和相关性评分模型对初选文档序列进行文档终选得到终选文档序列向当前用户反馈。本发明可以提升检索准确度。

技术关键词

文档检索方法编码器文本优化器大语言模型序列编码向量分词样本标签数据处理单元语义特征提取输入端模式矩阵参数模型训练模块索引

系统为您推荐了相关专利信息

一种阳极炉氧化还原期终点预测方法、系统、设备及介质

终点多层感知机阳极图像增强模块阶段

一种面向语音识别系统的预处理去偏方法

语音识别系统样本数据错误率文本

一种面向神经进化的社区搜索方法

社区搜索方法节点邻居粒子群算法编码器

一种基于大数据的社区公共安全综合风险评估方法

风险评估模型综合风险评估方法构建卷积神经网络多模态残差模块

一种基于语义和结构协同引导的点云配准方法

语义特征图像分割模型多模态特征融合矩阵图像像素

一种以大语言模型为编码器的文档检索方法和装置

站点导航

APP 下载