一种结合大语言模型和伪查询技术的稠密检索方法和装置

正文

推荐专利

申请号：CN202510332989

申请日期：2025-03-20

公开号：CN120256573B

公开日期：2025-11-18

类型：发明专利

摘要

本发明实施例涉及一种结合大语言模型和伪查询技术的稠密检索方法和装置，所述方法包括：选择第一大模型；并以BERT模型为第一、第二编码器构建伪查询‑文档评分模型；抽取查询‑反馈种子样本；配置三个大语言模型指令模板；根据种子样本和第一、第二指令模板构建第一数据集、并基于该数据集训练伪查询‑文档评分模型；训练结束后，接收用户侧输入的查询文本和历史检索信息，并基于历史检索信息进行查询‑反馈文本对提取，并基于提取出的文本对序列和查询文本进行伪反馈生成，并由查询、伪反馈组成伪查询，并基于伪查询进行稠密检索得到检索结果向当前用户反馈。本发明可以提高检索准确度、降低检索歧义问题的发生概率。

技术关键词

文档评分模型文本大语言模型语义相关度查询技术编码向量检索方法样本模板指令分词编码器序列种子数据优化器模型训练模块输入端

系统为您推荐了相关专利信息

一种UML类图信息提取方法、系统、介质及设备

信息提取方法关系光学字符识别技术 YOLO模型列表

一种面向伪造音频的检测特征增强方法、系统、设备及介质

音频特征矩阵编码器预训练模型音频编码

基于知识图谱的智能推荐方法、装置及智能推荐系统

智能推荐方法图谱生成推荐内容智能推荐系统生成答案

一种结合视觉语言模型和代码生成模型的单据信息提取方法、系统、设备及存储介质

信息提取方法单据文本定位组件意图识别

一种自适应资源调度与工单优先级排序的方法及系统

团队强化学习模型优化资源利用率决策工单系统

一种结合大语言模型和伪查询技术的稠密检索方法和装置

站点导航

APP 下载