摘要
本说明书实施例公开了一种用于训练模型的方法、装置、存储介质及电子设备,获得目标模型在不依赖外部知识源的情况下对于查询样本的第一输出,以及所述外部知识源对所述查询样本进行检索得到的第二输出;根据所述第一输出、所述第二输出以及所述查询样本对应的标签信息,确定所述查询样本对应的知识边界划分结果;根据所述目标模型对于所述查询样本的第三输出、所述标签信息以及所述知识边界划分结果,构建偏好数据集;通过直接偏好优化方法基于所述偏好数据集对所述目标模型进行训练,获得已训练的目标模型,使得所述已训练的目标模型能够在输入的目标查询超出所述参数知识边界及所述检索知识边界的情况下输出所述拒答响应信息。
技术关键词
样本
标签
数据
答案
模型训练模块
电子设备
计算机程序产品
处理器
参数
存储器
指令
语义
逻辑
指标
系统为您推荐了相关专利信息
自动化测试方法
数据管理模块
答案
项目管理模块
机器可读程序
无人叉车
动态任务调度方法
深度强化学习
仓库
动态任务调度系统
邻居
工业时序数据
异常检测方法
数据隐私保护
多传感器