摘要
本发明涉及信息检索技术领域,提供了一种基于大模型文档索引感知的对话式生成检索方法及系统。基于大模型文档索引感知的对话式生成检索方法包括,根据用户查询输入,采用已训练的大语言模型,输出与用户查询输入相关的信息排序列表;基于语料库,采用交叉注意力层,提取上下文的关键信息,得到命题,得到文档标识符;在第一阶段训练中,引入生成损失生成与当前查询相关的信息,并生成文档标识符;在第二阶段训练中,引入综合损失优化检索到的文档标识符的排名列表;通过束搜索解码策略,输出文档标识符对应的段落排名列表。本发明通过创新的文档标识符设计和训练策略,实现更有效的上下文理解和去噪,提升对话式检索的准确性和用户体验。
技术关键词
标识符
检索方法
索引
生成文档
大语言模型
列表
排序损失
计算机程序产品
解码
信息检索技术
注意力
策略
超参数
处理器
检索系统
样本
计算机设备
可读存储介质
存储器