用于获取大语言模型针对评测题目的评测结果的方法、用于评测大语言模型的方法及装置

正文

推荐专利

申请号：CN202510772232

申请日期：2025-06-10

公开号：CN120706548A

公开日期：2025-09-26

类型：发明专利

摘要

本说明书实施例公开了用于评测大语言模型的相关方法及相关装置。方法包括基于待测模型针对评测题目的初始答案，获取待测模型针对评测题目的初始评测结果，评测题目具有对应的参考答案，参考答案包括参考推理结果以及一个或多个参考推理步骤，初始评测结果包括推理正确、推理错误中的任一项，推理错误包括初始错误推理步骤以及对应于初始错误推理步骤的补充知识信息。基于补充知识信息，获取待测模型针对评测题目的增强答案。方法还包括基于参考答案、初始答案以及增强答案，获取待测模型针对评测题目的增强评测结果，增强评测结果包括知识不足错误以及推理不足错误，能够解耦大语言模型的知识能力和推理能力。

技术关键词

答案大语言模型记忆智能模型知识点存储程序指令计算机程序产品处理器模块关键词存储器电子设备场景

系统为您推荐了相关专利信息

一种文档问答方法、装置、电子设备及计算机存储介质

语义相关度排序模型样本数据问答方法

异构网络智能切片资源调度方法、装置、电子设备及介质

网络资源数据资源调度方法混合整数线性规划深度强化学习模型动态资源分配

一种基于多智能体的大语言模型自动渗透测试方法

渗透测试方法渗透测试工具任务调度语义向量列表

基于北斗卫星系统的海上平台应急控制方法及相关设备

应急控制方法北斗卫星系统风险预测模型北斗短报文时序演化规律

一种基于思维链的大语言模型的智慧供水决策系统

智慧供水决策系统供水企业大语言模型模块

用于获取大语言模型针对评测题目的评测结果的方法、用于评测大语言模型的方法及装置

站点导航

APP 下载