用于训练模型的方法、装置、存储介质及电子设备

正文

推荐专利

申请号：CN202511006751

申请日期：2025-07-21

公开号：CN120523957B

公开日期：2025-11-25

类型：发明专利

摘要

本说明书实施例公开了一种用于训练模型的方法、装置、存储介质及电子设备，获得目标模型在不依赖外部知识源的情况下对于查询样本的第一输出，以及所述外部知识源对所述查询样本进行检索得到的第二输出；根据所述第一输出、所述第二输出以及所述查询样本对应的标签信息，确定所述查询样本对应的知识边界划分结果；根据所述目标模型对于所述查询样本的第三输出、所述标签信息以及所述知识边界划分结果，构建偏好数据集；通过直接偏好优化方法基于所述偏好数据集对所述目标模型进行训练，获得已训练的目标模型，使得所述已训练的目标模型能够在输入的目标查询超出所述参数知识边界及所述检索知识边界的情况下输出所述拒答响应信息。

技术关键词

样本标签数据答案模型训练模块电子设备计算机程序产品处理器参数存储器指令语义逻辑指标

系统为您推荐了相关专利信息

一种自动化测试方法及装置

自动化测试方法数据管理模块答案项目管理模块机器可读程序

一种基于车辆驾驶行为的实时提醒方法、系统及电子设备

车辆导航设备交通管制区域消息规划

用于求解高维且带有约束的昂贵组合优化问题的方法

决策变量汉明距离航天器数据

一种基于冷链仓库深度强化学习的无人叉车动态任务调度方法及系统

无人叉车动态任务调度方法深度强化学习仓库动态任务调度系统

面向边缘设备的无监督工业时序数据快速异常检测方法

邻居工业时序数据异常检测方法数据隐私保护多传感器

用于训练模型的方法、装置、存储介质及电子设备

站点导航

APP 下载