一种大模型的评测方法、装置、电子设备及可读存储介质

正文

推荐专利

申请号：CN202510604683

申请日期：2025-05-12

公开号：CN120524174A

公开日期：2025-08-22

类型：发明专利

摘要

本申请提供了一种大模型的评测方法、装置、电子设备及可读存储介质，通过获取多任务、多场景下的评测集；将评测用例中的问题输入到待评测大模型中，生成实际评测答案；基于生成的实际评测答案、预期答案及多维度评测指标构建评测提示词。将评测提示词输入到预训练的裁判模型中得到待评测大模型的评测得分。本发明通过全面覆盖多种评测场景、多维度评估、高效自动化的评测方式、有效解决了传统评测方法存在的不足，能够为大模型的开发、上线和优化提供更精准、更高效、更实用的评测支持。

技术关键词

答案评测方法多场景多任务动态权重分配指标参数强化学习算法表头结构通信接口电子设备评测装置可读存储介质存储器处理器遗传算法计算机数据

系统为您推荐了相关专利信息

结合语义修正的大语言模型知识图谱问答方法和系统

知识图谱问答方法实体知识图谱问答系统逻辑大语言模型

一种基于Transformer-GNN的驾驶风格与交通密度联合识别方法

联合识别方法环境感知数据车辆行驶状态交互特征序列特征

基于用户意识超图的问答方法、装置、设备和介质

节点问答方法答案意图主题

一种基于非扭曲水印的交互式人机验证方法、装置及设备

人机验证方法统计特征水印方法人机验证装置答案

一种电力多场景应用的安全准入方法及系统

图像识别组件校准多场景人脸矩阵

一种大模型的评测方法、装置、电子设备及可读存储介质

站点导航

APP 下载