排名 模型 得分
🥇
289
tulu-2-dpo-70b AllenAI/UW · AI2 ImpACT Low-risk
1212±21.0 269 - 305 805 N/A 1212.000 [1191.0, 1233.0] 36.00 · 不稳 AI2 ImpACT Low-risk

没有找到相关模型