排名 模型 得分
🥇
306
tulu-2-dpo-70b AllenAI/UW · AI2 ImpACT Low-risk
1171±20.0 268 - 310 989 N/A 1171.000 [1151.0, 1191.0] 42.00 · 不稳 AI2 ImpACT Low-risk

没有找到相关模型