一种提升大语言模型可解释性的方法及装置

正文

推荐专利

一种提升大语言模型可解释性的方法及装置

申请号：CN202510792354

申请日期：2025-06-13

公开号：CN120875018A

公开日期：2025-10-31

类型：发明专利

摘要

本申请公开了一种提升大语言模型可解释性的方法。准备具有不同能力的两个大语言模型。由较弱模型对数学题进行思维链推理，输出推理的全部中间步骤和最终答案；由较强模型对较弱模型的每个推理步骤和最终答案进行判断。采用较弱模型和较强模型的输出内容训练一个过程奖励模型。利用训练好的所述过程奖励模型作为PVG方法中的验证者模型，由较弱模型作为PVG方法中的证明者模型，进行PVG的训练方法。进行PVG方法的迭代训练，直至狡猾的证明者不再能产生骗过验证者模型的错误步骤或错误结果时，训练停止。本申请能够更加细致和准确地判断证明者模型的输出内容，反映证明者模型的能力。

技术关键词

大语言模型答案强化学习算法策略数据

系统为您推荐了相关专利信息

一种数字化果园种植管理系统

种植管理系统数据采集模块构建决策树数字地图制作 GPS定位设备

基于元学习的变转速工况下风机轴承转速测算方法

转速测算方法风机轴承工况样本标签

直播音频审核方法、装置、计算机设备及存储介质

异常声音审核模型音频后台监控客户端

一种风力机叶片的设计方法及系统

风力机叶片螳螂拉丁超立方抽样样本变量

一种基于大模型的航天装备故障树生成方法

故障树生成方法排序模型编码规则装备文本

一种提升大语言模型可解释性的方法及装置

站点导航

APP 下载