直接偏好优化模型构建方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202410888281

申请日期：2024-07-04

公开号：CN118428324B

公开日期：2024-11-19

类型：发明专利

摘要

本发明公开了直接偏好优化模型构建方法、装置、电子设备及存储介质，所述方法包括：所述直接偏好优化模型构建方法包括：获取微调的初始模型；为所述初始模型选用uDPO框架并设置uDPO的超参数，得到目标函数；根据所述目标函数生成目标模型。通过构建uDPO框架，在uDPO中引入新的超参数，实现了对数据对可靠性的细粒度控制，从而在噪声环境下提供了更加平衡的探索与利用策略。其次，uDPO在保持DPO对点噪声固有鲁棒性的同时，通过优化最坏成对场景，显著提升了模型对抗成对噪声的能力，相较于DPO无论是在噪声还是无噪声的数据集上，均能实现性能的显著提升，具有DPO对抗点噪声的能力的同时具有对抗成对噪声的能力。

技术关键词

模型构建方法无噪声框架非暂态计算机可读存储介质数据噪声三元组拉格朗日模型构建装置电子设备表达式处理器超参数存储器鲁棒性因子样本模块

系统为您推荐了相关专利信息

图片修正方法、电子设备、存储介质及程序产品

图片修正方法重力传感器人物轮廓信息完整性校验

车辆主动悬架系统参数化多目标性能优化设计方法及系统

车辆主动悬架系统性能优化设计方法参数优化控制系统等价输入干扰

问答方法、装置、电子设备、存储介质及程序产品

查询特征时序特征语义特征问答方法意图识别模型

一种基于水文报汛异常数据处理的预报优化方法、系统及介质

XGBoost模型异常数据处理水文异常数据点门控循环单元

通过转移性淋巴结预测新辅助免疫治疗后预后的预测模型及其构建方法

预测模型构建方法单细胞转录组肿瘤微环境转录组测序技术免疫疗法

直接偏好优化模型构建方法、装置、电子设备及存储介质

站点导航

APP 下载