偏好学习方法、模型应用方法、装置、设备和存储介质

正文

推荐专利

申请号：CN202411820212

申请日期：2024-12-11

公开号：CN119646161A

公开日期：2025-03-18

类型：发明专利

摘要

本公开提供了一种偏好学习方法，可以应用于人工智能技术领域。该偏好学习方法包括：从大模型预训练的文本文档中，确定与预设标准相匹配的样本问题，其中，预设标准中包括正向标准和反向标准，样本问题用于表征用户与大模型交互时所产生的问题；将多个样本问题输入大模型中，以根据大模型输出的与每个样本问题对应的答案，生成多个问答对；利用多个评估模型，基于正向标准分别对每个问答对中的答案进行评估，得到与每个问答对对应的评估标签；利用基于评估标签生成的偏好数据，对大模型进行训练，得到与正向标准对齐的目标模型。本公开还提供了一种模型应用方法、偏好学习装置、设备、存储介质和程序产品。

技术关键词

答案模型预训练样本标签学习方法学习装置多模型模型训练模块人工智能技术计算机程序产品处理器数据指令可读存储介质电子设备存储器关系

系统为您推荐了相关专利信息

基于轮廓增强和协同训练的半监督SAR目标识别方法及系统

识别方法标签训练集半监督学习轮廓提取感兴趣

一种人工智能图像生成方法、装置

人工智能图像注意力文本样本融合图像特征

寄生参数提取神经网络分布式训练方法及装置

寄生参数提取分布式训练方法训练样本数据模型更新互连线

一种三维目标的重建和单体化方法与系统

单体化方法孪生神经网络标签掩膜视频

一种地表水径流量估算方法与系统

径流地表水短波红外波段反射率差异历史数据查询

偏好学习方法、模型应用方法、装置、设备和存储介质

站点导航

APP 下载