排名 模型 得分
🥇
295
tulu-2-dpo-70b AllenAI/UW · AI2 ImpACT Low-risk
1144±19.0 281 - 312 888 N/A 1144.000 [1125.0, 1163.0] 31.00 · 不稳 AI2 ImpACT Low-risk

没有找到相关模型