大语言模型的评估方法、装置和计算机设备

正文

推荐专利

大语言模型的评估方法、装置和计算机设备

申请号：CN202410771077

申请日期：2024-06-14

公开号：CN118535443A

公开日期：2024-08-23

类型：发明专利

摘要

本申请涉及人工智能领域，具体公开了一种大语言模型的评估方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括：获取预设的多个功能维度的采集数据以及待评估的大语言模型；其中，所述多个功能维度至少包括语言理解、计算能力和推理逻辑；分别将所述多个功能维度的采集数据输入到待评估的大语言模型中，得到所述采集数据分别对应的预测结果；将所述预测结果与对应功能维度的采集数据的参考结果进行对比，得到所述预测结果对应的维度评分；根据所述待评估的大语言模型的各功能维度的预测结果对应的维度评分，得到所述待评估的大语言模型的综合评分。采用本方法能够提高大语言模型评估的准确性和可靠性。

技术关键词

文本大语言模型网络资源数据计算机设备计算机程序产品分子可读存储介质数据获取模块字符处理器评估装置逻辑实体存储器策略子模块

系统为您推荐了相关专利信息

对话式数据分析方法、装置、存储介质及电子设备

自然语言文本数据分析方法数据分析装置语义数据模型指标

视频帧提取方法、装置、设备及介质

视频帧提取方法卷积特征提取关键帧注意力计算机设备

基于潜水灯的潜水告警方法、装置、计算机设备和介质

潜水灯告警方法数据滤波算法判断算法监控设备

手势识别方法、装置、计算机设备、存储介质和计算机程序产品

深度图像数据分类网络手势识别方法矫正模型空间结构特征

腹膜疾病风险预测方法、系统、电子设备及存储介质

医疗影像数据影像特征数据形态疾病风险预测方法注意力

大语言模型的评估方法、装置和计算机设备

站点导航

APP 下载