排名 模型 得分
🥇
175.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1315±14.4 72 - 184 1.9K $0.20 / $0.60 65.5K 1314.519 [1300.1, 1328.9] 54.05 · 不稳 Apache 2.0
🥈
209.0
olmo-3-32b-think Allen AI · Apache 2.0
1310±19.7 118 - 220 1.0K $0.15 / $0.50 65.5K 1310.451 [1290.7, 1330.2] 101.18 · 不稳 Apache 2.0
🥉
226.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1285±16.5 111 - 210 1.4K $0.15 / $0.50 65.5K 1285.096 [1268.6, 1301.6] 71.04 · 不稳 Apache 2.0
4
224.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1267±24.6 172 - 258 520 N/A N/A 1267.254 [1242.7, 1291.8] 157.26 · 不稳 Llama 3.1
5
247.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1240±24.0 214 - 266 580 $0.05 / $0.20 128K 1239.630 [1215.7, 1263.6] 149.57 · 不稳 Apache-2.0
6
266.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1194±24.8 240 - 291 516 N/A N/A 1193.805 [1169.0, 1218.6] 159.80 · 不稳 Llama 3.1
7
288.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1105±19.0 273 - 319 1.1K N/A N/A 1105.368 [1086.4, 1124.3] 93.76 · 不稳 AI2 ImpACT Low-risk
8
329.0
olmo-7b-instruct Allen AI · Apache-2.0
1008±20.1 306 - 323 1.2K $0.20 / $0.20 N/A 1008.357 [988.2, 1028.5] 105.52 · 不稳 Apache-2.0

没有找到相关模型