排名 模型 得分
🥇
175.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1350±11.9 72 - 184 2.5K $0.20 / $0.60 65.5K 1349.921 [1338.1, 1361.8] 36.66 · 不稳 Apache 2.0
🥈
209.0
olmo-3-32b-think Allen AI · Apache 2.0
1321±18.4 118 - 220 1.1K $0.15 / $0.50 65.5K 1320.563 [1302.1, 1339.0] 88.60 · 不稳 Apache 2.0
🥉
226.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1288±15.5 111 - 210 1.6K $0.15 / $0.50 65.5K 1288.495 [1273.0, 1304.0] 62.37 · 不稳 Apache 2.0
4
224.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1236±24.2 172 - 258 450 N/A N/A 1235.833 [1211.6, 1260.0] 152.37 · 不稳 Llama 3.1
5
247.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1211±27.9 214 - 266 427 $0.05 / $0.20 128K 1210.528 [1182.6, 1238.5] 203.22 · 不稳 Apache-2.0
6
266.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1184±24.8 240 - 291 476 N/A N/A 1183.866 [1159.0, 1208.7] 160.46 · 不稳 Llama 3.1
7
288.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1117±21.4 273 - 319 805 N/A N/A 1116.605 [1095.2, 1138.1] 119.75 · 不稳 AI2 ImpACT Low-risk
8
329.0
olmo-7b-instruct Allen AI · Apache-2.0
1016±22.2 306 - 323 772 $0.20 / $0.20 N/A 1016.100 [993.9, 1038.3] 127.77 · 不稳 Apache-2.0

没有找到相关模型