摘要
本申请提供了一种检索增强生成系统的优化方法、装置、设备及介质。包括:根据从知识库内提取的文档,及对文档进行切分得到的文本片段,构建模型训练数据;基于模型训练数据对向量化模型进行模型参数的优化;基于向量化模型对用户问题和文本片段进行处理,得到检索片段;根据检索片段、用户问题和会话上下文,配置提示词;调用生成模型对用户问题和提示词进行处理,生成问题答案文本;采用监督微调与奖励反馈训练的方式,根据标准答案文本、用户问题和根据用户问题检索到的文本形成的问答数据集对生成模型进行优化;根据问题答案文本、用户问题的人工标注数据和问答评测指标集,确定目标评测指标,以根据目标评测指标对检索增强生成系统的性能进行评测。
技术关键词
生成系统
文本
问答对数据
指标
评测方法
样本
强化学习算法
电子设备
生成答案
参数
排序模型
处理器
切片
模块
优化装置
忠诚度
可读存储介质
索引