大模型的模型能力分类评估方法、装置、设备及介质

正文

推荐专利

申请号：CN202510708240

申请日期：2025-05-29

公开号：CN120408117A

公开日期：2025-08-01

类型：发明专利

摘要

本申请公开了大模型的模型能力分类评估方法、装置、设备及介质，涉及人工智能技术领域，包括：确定待评估大模型的任务评估类型，基于子能力评估项和具体测试场景生成的对应测试任务数据，并对测试任务数据进行前置格式化处理，以得到格式化处理后的目标测试任务数据；将目标测试任务数据输入至待评估大模型，调用模型参数加载功能，以便待评估大模型加载相应的模型参数后对目标测试任务数据进行任务处理，得到测试结果指标；对测试结果指标执行人工评估，得到相应的模型能力评估结果，以利用模型能力评估结果优化待评估大模型。实现不同场景不同测试任务下的大模型的模型能力准确评估。

技术关键词

分类评估方法非标准格式化测试场景指标标签参数启发式规则多模态存储计算机程序多轮对话人工智能技术数据处理模块意图识别字符评估装置文本多语言

系统为您推荐了相关专利信息

一种获取复杂断面型钢无弯扭变形的热轧方法

断面型钢热轧方法轧辊辊径轧制工艺参数成品

一种连铸坯表面三维组合成像检测系统及方法

三维立体模型表面图像数据成像检测方法表面纹理特征成像检测系统

顶板动态与支护质量智能监控方法及系统

液压支架支护智能监控方法时间序列预测模型动态采煤工作面

一种基于大语言模型的邮件内容生成方法及系统

邮件内容生成方法大语言模型推理平台格式化内容生成系统

多智能体协作博弈的复杂事件分析处理方法及装置

多智能体协作反馈规则协作博弈标准化模板指令

大模型的模型能力分类评估方法、装置、设备及介质

站点导航

APP 下载