排名 模型 得分
🥇
295
tulu-2-dpo-70b AllenAI/UW · AI2 ImpACT Low-risk
1186±16.0 283 - 309 1.4K N/A 1186.000 [1170.0, 1202.0] 26.00 · 不稳 AI2 ImpACT Low-risk

没有找到相关模型