排名 模型 得分
🥇
168.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1272±13.2 72 - 184 2.1K $0.20 / $0.60 65.5K 1271.848 [1258.7, 1285.0] 45.10 · 不稳 Apache 2.0
🥈
177.0
olmo-3-32b-think Allen AI · Apache 2.0
1255±18.5 118 - 220 1.1K $0.15 / $0.50 65.5K 1255.087 [1236.6, 1273.5] 88.73 · 不稳 Apache 2.0
🥉
217.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1240±22.6 172 - 258 551 N/A N/A 1240.315 [1217.7, 1262.9] 132.89 · 不稳 Llama 3.1
4
206.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1236±14.9 111 - 210 1.7K $0.15 / $0.50 65.5K 1236.500 [1221.6, 1251.4] 57.53 · 不稳 Apache 2.0
5
238.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1225±23.5 214 - 266 606 $0.05 / $0.20 128K 1224.725 [1201.3, 1248.2] 143.23 · 不稳 Apache-2.0
6
247.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1161±23.1 240 - 291 563 N/A N/A 1161.055 [1138.0, 1184.1] 138.51 · 不稳 Llama 3.1
7
280.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1116±20.3 273 - 319 989 N/A N/A 1115.775 [1095.4, 1136.1] 107.79 · 不稳 AI2 ImpACT Low-risk
8
322.0
olmo-7b-instruct Allen AI · Apache-2.0
991±21.0 306 - 323 876 $0.20 / $0.20 N/A 991.033 [970.0, 1012.1] 115.17 · 不稳 Apache-2.0

没有找到相关模型