一种数据科学领域大语言模型评估方法、装置及存储介质

正文

推荐专利

申请号：CN202411561121

申请日期：2024-11-04

公开号：CN119578522B

公开日期：2025-10-24

类型：发明专利

摘要

本发明涉及数据科学技术领域，尤其是指一种数据科学领域大语言模型评估方法、装置、设备及计算机存储介质。本发明所述的大语言模型评估方法，从粗粒度的角度来看，首先汇总任务类型、函数和相应的代码的范围，然后，从细粒度的角度来看，根据特定的任务为每个函数的输出定义编程规则，并将结果与标准答案进行比较，最终，通过生成的测试用例集对目标大语言模型进行评估；本发明从综合的角度为每个子任务生成标准答案并定义特定的评估指标，从而能够面向更复杂的由多个子任务组成的现实世界任务的大语言模型评估。

技术关键词

大语言模型模型评估方法典型测试用例集生成答案三元组数据科学技术计算机存储介质可读存储介质代码更新预测建模数据可视化存储计算机程序评估设备数据获取模块数据处理模块评估装置定义

系统为您推荐了相关专利信息

一种欠完备数字孪生系统及其构建方法及计算机装置

数字孪生系统环境状态信息计算机装置轨迹编码器

大语言模型的微调方法、装置、存储介质及计算机设备

样本聚类数据大语言模型微调方法

基于大模型的英语智能出题方法及系统

动态知识图谱智能出题方法生成知识图谱英语教材查询模型

基于大语言模型的文本协调性检测方法

文本大语言模型文件属性信息排版标识

图像处理方法、装置、电子设备、存储介质和程序产品

图像特征信息参数语义序列数据

一种数据科学领域大语言模型评估方法、装置及存储介质

站点导航

APP 下载