摘要
本公开实施例涉及一种模型评测方法、装置、设备及介质,其中该方法包括:获取多个待测模型以及历史评测结果;基于所述多个待测模型以及历史评测结果生成多个评测任务,其中,每个评测任务定义两个待测模型进行对比评测;对多个评测任务生成对应的多个评测数据;将多个评测数据分发给评测用户进行评测,得到多个评测任务对应的多个单评测结果;基于多个待测模型的初始分数以及多个单评测结果采用对弈水平评分方式确定多个待测模型的当前分数;根据多个待测模型的当前分数确定模型排序结果。本公开提升了模型评测的效率和易用性,并且不同模型通过权威性以及准确性较高的对弈水平评分方式进行排序确定,提升了排序结果的可靠性和准确性。
技术关键词
模型评测方法
评测装置
数据模块
电子设备
处理器
定义
页面
可读存储介质
指令
存储器
控件
计算机
视频
系统为您推荐了相关专利信息
多级特征
业务规则库
数据标注方法
联合损失函数
语义
Apriori算法
权限控制方法
结构层次关系
组织
置信度阈值