排名 模型 得分
🥇
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1314±24.1 72 - 184 662 $0.20 / $0.60 65.5K 1313.953 [1289.8, 1338.1] 151.28 · 不稳 Apache 2.0
🥈
olmo-3-32b-think Allen AI · Apache 2.0
1290±36.4 118 - 220 305 $0.15 / $0.50 65.5K 1290.108 [1253.7, 1326.5] 344.22 · 不稳 Apache 2.0
🥉
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1249±36.2 172 - 258 224 N/A N/A 1248.576 [1212.4, 1284.8] 341.39 · 不稳 Llama 3.1
4
olmo-3.1-32b-think Allen AI · Apache 2.0
1245±27.3 111 - 210 557 $0.15 / $0.50 65.5K 1245.434 [1218.1, 1272.7] 193.80 · 不稳 Apache 2.0
5
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1191±36.6 214 - 266 229 $0.05 / $0.20 128K 1191.142 [1154.5, 1227.7] 348.85 · 不稳 Apache-2.0
6
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1175±36.5 240 - 291 238 N/A N/A 1174.985 [1138.5, 1211.5] 346.76 · 不稳 Llama 3.1
7
olmo-7b-instruct Allen AI · Apache-2.0
1013±23.4 306 - 323 722 $0.20 / $0.20 N/A 1012.928 [989.5, 1036.3] 142.53 · 不稳 Apache-2.0
8
85
molmo-72b-0924 Allen AI · Apache 2.0
928±51.2 71 - 88 182 N/A N/A 927.721 [876.6, 978.9] 681.41 · 不稳 Apache 2.0
9
98
molmo-7b-d-0924 Allen AI · Apache 2.0
881±50.1 76 - 88 171 N/A N/A 881.408 [831.3, 931.5] 652.85 · 不稳 Apache 2.0

没有找到相关模型