基于裁判模型的大语言模型评价方法、装置、设备及介质

正文

推荐专利

申请号：CN202411940326

申请日期：2024-12-26

公开号：CN119862889A

公开日期：2025-04-22

类型：发明专利

摘要

本公开涉及一种基于裁判模型的大语言模型评价方法、装置、设备及介质，该方法包括：将预先获取的测试问题分别输入待评价的多个大语言模型，并获取各个大语言模型的输出结果；将测试问题、各个大语言模型的输出结果以及预设的第一引导指令输入预先建立的裁判模型，得到裁判模型输出的模型评价结果，第一引导指令用于引导裁判模型采用准确性、相关性、创造性、逻辑连贯性和信息完整性等目标评价标准对多个大语言模型的模型性能进行评价，模型评价结果包括性能最优的目标大语言模型的信息的。本公开通过将多个大语言模型针对同一问题的输出结果输入裁判模型，引导裁判模型从多角度对各个大语言模型的输出结果进行评价，能够自动对大语言模型进行全面评价。

技术关键词

大语言模型模型评价方法指令文本聚类评价装置逻辑处理器计算机设备输入模块可读存储介质存储器多角度关系

系统为您推荐了相关专利信息

基于环境变化感知的LED模组控制系统

LED模组环境感知模型环境感知数据亮度数据采集模块

一种基于合成语音的语音识别方法

语音识别方法输出特征适配器解码器判别特征

一种基于医疗病案的知识库构建方法

知识库构建方法密度峰值聚类算法语义文本分词技术

一种任务调度方法、装置、汽车芯片及介质

任务调度方法策略任务调度装置时间片动态场景

大规模路网区域间热点路径识别方法

路径识别方法车牌识别数据单车局部敏感哈希算法行程

基于裁判模型的大语言模型评价方法、装置、设备及介质

站点导航

APP 下载