排名 模型 得分
🥇
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1309±27.3 72 - 184 522 $0.20 / $0.60 65.5K 1309.192 [1281.9, 1336.5] 194.40 · 不稳 Apache 2.0
🥈
olmo-3-32b-think Allen AI · Apache 2.0
1294±37.3 118 - 220 288 $0.15 / $0.50 65.5K 1293.557 [1256.3, 1330.8] 361.29 · 不稳 Apache 2.0
🥉
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1248±36.3 172 - 258 223 N/A N/A 1248.267 [1212.0, 1284.6] 343.29 · 不稳 Llama 3.1
4
olmo-3.1-32b-think Allen AI · Apache 2.0
1247±28.1 111 - 210 531 $0.15 / $0.50 65.5K 1247.410 [1219.3, 1275.5] 205.26 · 不稳 Apache 2.0
5
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1191±36.6 214 - 266 229 $0.05 / $0.20 128K 1190.621 [1154.0, 1227.2] 348.35 · 不稳 Apache-2.0
6
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1174±36.6 240 - 291 237 N/A N/A 1174.133 [1137.5, 1210.7] 348.67 · 不稳 Llama 3.1
7
olmo-7b-instruct Allen AI · Apache-2.0
1013±23.3 306 - 323 722 $0.20 / $0.20 N/A 1012.636 [989.4, 1035.9] 140.94 · 不稳 Apache-2.0
8
73
molmo-72b-0924 Allen AI · Apache 2.0
924±50.4 71 - 88 182 N/A N/A 924.426 [874.0, 974.9] 662.24 · 不稳 Apache 2.0
9
86
molmo-7b-d-0924 Allen AI · Apache 2.0
878±49.3 76 - 88 171 N/A N/A 878.119 [828.8, 927.5] 633.96 · 不稳 Apache 2.0

没有找到相关模型