摘要
本公开提供了一种提示词重构模型训练、检索增强生成方法、装置及设备,涉及智能查询、检索增强生成等人工智能技术领域。该方法包括:获取初始提示词重构模型基于预设意图理解能力数据集中的查询词输出的第一提示词重构结果;意图理解能力数据集中包含基于历史多轮对话的原始查询词及对应的意图推理提示词;基于第一提示词重构结果及意图推理提示词对初始提示词重构模型进行调参,得到初调提示词重构模型;获取初调提示词重构模型基于查询词输出的第二提示词重构结果,并基于第二提示词重构结果与意图推理提示词构成偏好数据集;基于偏好数据集及奖励模型对初调提示词重构模型进行训练,得到训练后的提示词重构模型。
技术关键词
重构模型
意图
多轮对话
生成系统
生成方法
数据
文本
大语言模型
人工智能技术
训练装置
处理器通信
模块
生成装置
存储器
策略
标签
样本
电子设备