摘要
本发明属于智能对话技术领域,提供了一种用于多轮对话式问答的检索增强方法、系统及应用,通过构建含咨询问题、文档、答案及改写检索文本的四元组数据集,结合对话状态缓存与混合检索策略,利用Rewriter模型生成以检索任务为主要导向的改写文本,根据改写后的文本,动态挖掘新的难例,结合生成损失函数和多正样本对比损失函数构建联合损失函数,联合优化Rewriter模型。本发明提出多正样本对比损失函数以充分利用多轮数据集中的监督信号,提高改写模型对上下文的理解能力;提出了动态难例挖掘方法,在训练过程中根据改写结果实时做动态挖掘,以解决无法根据检索反馈实时优化改写查询的问题。
技术关键词
文本
问答系统
联合损失函数
检索策略
样本
自然语言推理
数据
关键词
对话管理器
答案
智能对话技术
多轮对话场景
动态
话题
BERT模型
指令
挖掘方法
模块
种子
系统为您推荐了相关专利信息
校正策略
校正方法
机器学习模型
线性回归模型
误差
指纹特征
样本
设备识别方法
网络信息安全技术
套件
文本
智能问答方法
多标签
生成提示词
语义检索模型
图谱特征
XGBoost模型
路径特征
节点
低轨卫星星座