摘要
本申请公开了一种提升大语言模型可解释性的方法。准备具有不同能力的两个大语言模型。由较弱模型对数学题进行思维链推理,输出推理的全部中间步骤和最终答案;由较强模型对较弱模型的每个推理步骤和最终答案进行判断。采用较弱模型和较强模型的输出内容训练一个过程奖励模型。利用训练好的所述过程奖励模型作为PVG方法中的验证者模型,由较弱模型作为PVG方法中的证明者模型,进行PVG的训练方法。进行PVG方法的迭代训练,直至狡猾的证明者不再能产生骗过验证者模型的错误步骤或错误结果时,训练停止。本申请能够更加细致和准确地判断证明者模型的输出内容,反映证明者模型的能力。
技术关键词
大语言模型
答案
强化学习算法
策略
数据
系统为您推荐了相关专利信息
种植管理系统
数据采集模块
构建决策树
数字地图制作
GPS定位设备