一种结合大语言模型和伪查询技术的稠密检索方法和装置

AITNT
正文
推荐专利
一种结合大语言模型和伪查询技术的稠密检索方法和装置
申请号:CN202510332989
申请日期:2025-03-20
公开号:CN120256573B
公开日期:2025-11-18
类型:发明专利
摘要
本发明实施例涉及一种结合大语言模型和伪查询技术的稠密检索方法和装置,所述方法包括:选择第一大模型;并以BERT模型为第一、第二编码器构建伪查询‑文档评分模型;抽取查询‑反馈种子样本;配置三个大语言模型指令模板;根据种子样本和第一、第二指令模板构建第一数据集、并基于该数据集训练伪查询‑文档评分模型;训练结束后,接收用户侧输入的查询文本和历史检索信息,并基于历史检索信息进行查询‑反馈文本对提取,并基于提取出的文本对序列和查询文本进行伪反馈生成,并由查询、伪反馈组成伪查询,并基于伪查询进行稠密检索得到检索结果向当前用户反馈。本发明可以提高检索准确度、降低检索歧义问题的发生概率。
技术关键词
文档评分模型 文本 大语言模型 语义相关度 查询技术 编码向量 检索方法 样本 模板 指令 分词 编码器 序列 种子 数据 优化器 模型训练模块 输入端
系统为您推荐了相关专利信息
1
一种UML类图信息提取方法、系统、介质及设备
信息提取方法 关系 光学字符识别技术 YOLO模型 列表
2
一种面向伪造音频的检测特征增强方法、系统、设备及介质
音频特征 矩阵 编码器 预训练模型 音频编码
3
基于知识图谱的智能推荐方法、装置及智能推荐系统
智能推荐方法 图谱 生成推荐内容 智能推荐系统 生成答案
4
一种结合视觉语言模型和代码生成模型的单据信息提取方法、系统、设备及存储介质
信息提取方法 单据 文本 定位组件 意图识别
5
一种自适应资源调度与工单优先级排序的方法及系统
团队 强化学习模型 优化资源利用率 决策 工单系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号