大语言模型价值对齐方法及装置

正文

推荐专利

大语言模型价值对齐方法及装置

申请号：CN202411903284

申请日期：2024-12-23

公开号：CN119829946B

公开日期：2025-08-08

类型：发明专利

摘要

本申请实施例公开了一种大语言模型价值对齐方法，包括：获取多个问题查询文本及对应的候选答案池；确定候选答案池中各候选答案的奖励得分，生成训练样本数据集；确定各候选答案的回答概率，根据多个候选答案的回答概率及奖励得分计算各问题查询文本的第一奖励期望，根据所有第一奖励期望计算所有问题查询文本的第二奖励期望；根据第二奖励期望及训练样本数据集对大语言模型进行价值对齐调整以对模型参数进行调整，判断是否满足预定收敛条件；若否，则根据调整后的大语言模型生成各问题查询文本的多个新的候选答案，根据多个新的候选答案对候选答案池进行更新，跳转执行确定奖励得分；若是，则生成目标大语言模型，提升了模型价值对齐能力。

技术关键词

答案训练样本数据文本大语言模型对齐方法分词生成训练样本模块通信接口处理器计算机存储介质指令对齐装置计算机程序产品参数存储器

系统为您推荐了相关专利信息

基于大语言模型动态优化的数字资产评估方法及系统

大语言模型资产评估方法报告模板数据分析模块

法律支持系统的控制方法、设备及存储介质

案件实体解析方法生成法律文书关系

卸油交运方法和卸油交运装置

交运方法油罐车语音文字识别音频阀体结构

一种基于NLP的文本相似度分析方法及系统

文本特征向量度分析方法 Pearson相关系数序列自由端

图像质量评测方法、装置、设备、存储介质和程序产品

关键词图像文本人机交互界面显示评测方法

大语言模型价值对齐方法及装置

站点导航

APP 下载