摘要
一种基于段落相关性判别的迭代检索优化方法,该方法利用预训练语言模型和高效检索系统从大规模文本库中获取与输入查询的问题最相关的文档或段落,通过微调一个段落相关性判别模型,在每一轮迭代检索时评估原问题与检索到的段落之间的相关性,并排除不相关的段落,从而有效避免了错误传导的问题。当所有检索到的段落均被判定为不相关时,系统将切换至zero‑shot模式进行回答,确保即便在缺乏直接相关信息的情况下也能提供初步的答案。该方法无需引入额外的大规模计算资源或其他复杂模型,即可显著提升问答系统和对话系统的性能及可靠性,使得最终输出的答案更加准确、可靠。
技术关键词
预训练语言模型
向量检索方法
检索系统
对话系统
问答系统
答案
训练集
连续性
模式
语义
标签
基础
数据