摘要
本发明公开了一种通过思维链策略重写查询的会话式检索方法,该方法首先利用大语言模型对所有文档进行文本概括,得到压缩表示。其次利用检索模型离线计算压缩文档的编码表示。然后对于一组已经确定主题的会话式查询,根据思维链的提示策略,利用大语言模型获得与当前查询相关的历史查询,再进行重写。最后对重写后查询计算其编码表示,将其与当前会话相关的压缩文档编码表示子集,使用ColBERT计算语义相似度,并由大到小对文档排序,获得检索结果。本发明大幅提升检索效率,使用户快速获取所需信息。
技术关键词
检索方法
大语言模型
文本概括
策略
编码
会话主题
查询意图
生成向量
交互技术
离线
语义
冗余
标记
对象