一种数据科学领域大语言模型评估方法、装置及存储介质

AITNT
正文
推荐专利
一种数据科学领域大语言模型评估方法、装置及存储介质
申请号:CN202411561121
申请日期:2024-11-04
公开号:CN119578522B
公开日期:2025-10-24
类型:发明专利
摘要
本发明涉及数据科学技术领域,尤其是指一种数据科学领域大语言模型评估方法、装置、设备及计算机存储介质。本发明所述的大语言模型评估方法,从粗粒度的角度来看,首先汇总任务类型、函数和相应的代码的范围,然后,从细粒度的角度来看,根据特定的任务为每个函数的输出定义编程规则,并将结果与标准答案进行比较,最终,通过生成的测试用例集对目标大语言模型进行评估;本发明从综合的角度为每个子任务生成标准答案并定义特定的评估指标,从而能够面向更复杂的由多个子任务组成的现实世界任务的大语言模型评估。
技术关键词
大语言模型 模型评估方法 典型 测试用例集 生成答案 三元组 数据科学技术 计算机存储介质 可读存储介质 代码更新 预测建模 数据可视化 存储计算机程序 评估设备 数据获取模块 数据处理模块 评估装置 定义
系统为您推荐了相关专利信息
1
一种欠完备数字孪生系统及其构建方法及计算机装置
数字孪生系统 环境状态信息 计算机装置 轨迹 编码器
2
大语言模型的微调方法、装置、存储介质及计算机设备
样本 聚类 数据 大语言模型 微调方法
3
基于大模型的英语智能出题方法及系统
动态知识图谱 智能出题方法 生成知识图谱 英语教材 查询模型
4
基于大语言模型的文本协调性检测方法
文本 大语言模型 文件属性信息 排版 标识
5
图像处理方法、装置、电子设备、存储介质和程序产品
图像特征信息 参数 语义 序列 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号