排名 模型 得分
🥇
289
tulu-2-dpo-70b AllenAI/UW · AI2 ImpACT Low-risk
1197±17.0 277 - 309 1.5K N/A 1197.000 [1180.0, 1214.0] 32.00 · 不稳 AI2 ImpACT Low-risk

没有找到相关模型