排名 模型 得分
🥇
289
tulu-2-dpo-70b AllenAI/UW · AI2 ImpACT Low-risk
1168±15.0 268 - 295 2.0K N/A 1168.000 [1153.0, 1183.0] 27.00 · 不稳 AI2 ImpACT Low-risk

没有找到相关模型