摘要
一种用于大语言模型的模型评估方法、装置、介质及设备,涉及大语言模型技术领域,所述方法包括:根据第一配置指令,生成用于对大语言模型进行模型评估的评估工作流,其中,所述评估工作流中包含评估节点;根据第二配置指令,确定所述评估节点对应的评估方法;基于评估数据集执行所述评估工作流,以在执行所述评估节点时基于所述评估方法和所述评估数据集对所述大语言模型进行模型评估,其中,所述评估数据集中包含至少一个评估题目。由此在对大语言模型进行模型评估时,可以通过编排而生成用于评估的评估工作流,无需评估人员进行脚本编写,既可以降低人工工作量,又可以提高评估工作流编排的灵活性,提升评估工作流和实际评估任务的适配性。
技术关键词
模型评估方法
评估工作流
大语言模型
节点
指令
评估装置
数据
存储装置
人工工作量
标识
计算机程序产品
日志
展示界面
快照
介质
电子设备
模块
脚本
处理器
系统为您推荐了相关专利信息
协同控制方法
新能源厂站
光伏发电组件
无功补偿设备
模拟退火算法
输电线路动态增容
智能调控方法
新能源发电量
负荷预测误差
传感器融合算法
关键词
主题
文献推荐方法
计算机可执行指令
分词
实体识别模型
关系挖掘方法
神经网络模型
文本
节点特征