摘要
本发明实施例涉及一种结合大语言模型和伪查询技术的稠密检索方法和装置,所述方法包括:选择第一大模型;并以BERT模型为第一、第二编码器构建伪查询‑文档评分模型;抽取查询‑反馈种子样本;配置三个大语言模型指令模板;根据种子样本和第一、第二指令模板构建第一数据集、并基于该数据集训练伪查询‑文档评分模型;训练结束后,接收用户侧输入的查询文本和历史检索信息,并基于历史检索信息进行查询‑反馈文本对提取,并基于提取出的文本对序列和查询文本进行伪反馈生成,并由查询、伪反馈组成伪查询,并基于伪查询进行稠密检索得到检索结果向当前用户反馈。本发明可以提高检索准确度、降低检索歧义问题的发生概率。
技术关键词
文档评分模型
文本
大语言模型
语义相关度
查询技术
编码向量
检索方法
样本
模板
指令
分词
编码器
序列
种子
数据
优化器
模型训练模块
输入端
系统为您推荐了相关专利信息
信息提取方法
关系
光学字符识别技术
YOLO模型
列表
智能推荐方法
图谱
生成推荐内容
智能推荐系统
生成答案
团队
强化学习模型
优化资源利用率
决策
工单系统