排名 模型 得分
🥇
175.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1351±9.3 72 - 184 4.2K $0.20 / $0.60 65.5K 1351.034 [1341.7, 1360.4] 22.75 · 不稳 Apache 2.0
🥈
209.0
olmo-3-32b-think Allen AI · Apache 2.0
1333±13.7 118 - 220 1.9K $0.15 / $0.50 65.5K 1332.553 [1318.9, 1346.2] 48.71 · 不稳 Apache 2.0
🥉
178.0
molmo-2-8b Allen AI · Apache 2.0
1301±36.2 143 - 242 287 $0.20 / $0.20 36.9K 1301.455 [1265.3, 1337.6] 340.76 · 不稳 Apache 2.0
4
226.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1299±11.7 111 - 210 2.8K $0.15 / $0.50 65.5K 1298.819 [1287.1, 1310.5] 35.45 · 不稳 Apache 2.0
5
224.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1243±20.1 172 - 258 711 N/A N/A 1242.634 [1222.6, 1262.7] 104.92 · 不稳 Llama 3.1
6
247.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1215±21.8 214 - 266 740 $0.05 / $0.20 128K 1214.651 [1192.8, 1236.5] 124.12 · 不稳 Apache-2.0
7
266.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1192±20.0 240 - 291 761 N/A N/A 1192.394 [1172.4, 1212.4] 103.77 · 不稳 Llama 3.1
8
288.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1111±16.9 273 - 319 1.5K N/A N/A 1110.974 [1094.1, 1127.8] 73.92 · 不稳 AI2 ImpACT Low-risk
9
329.0
olmo-7b-instruct Allen AI · Apache-2.0
1038±17.7 306 - 323 1.5K $0.20 / $0.20 N/A 1038.038 [1020.3, 1055.7] 81.54 · 不稳 Apache-2.0

没有找到相关模型