排名 模型 得分
🥇
293
tulu-2-dpo-70b AllenAI/UW · AI2 ImpACT Low-risk
1141±20.0 278 - 307 751 N/A 1141.000 [1121.0, 1161.0] 29.00 · 不稳 AI2 ImpACT Low-risk

没有找到相关模型