排名 模型 得分
🥇
168.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1301±27.1 72 - 184 533 $0.20 / $0.60 65.5K 1301.285 [1274.2, 1328.4] 190.96 · 不稳 Apache 2.0
🥈
177.0
olmo-3-32b-think Allen AI · Apache 2.0
1299±38.8 118 - 220 266 $0.15 / $0.50 65.5K 1298.625 [1259.8, 1337.4] 391.86 · 不稳 Apache 2.0
🥉
206.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1253±28.6 111 - 210 495 $0.15 / $0.50 65.5K 1252.978 [1224.4, 1281.5] 212.30 · 不稳 Apache 2.0
4
217.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1248±36.2 172 - 258 224 N/A N/A 1248.390 [1212.2, 1284.6] 341.57 · 不稳 Llama 3.1
5
238.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1191±36.6 214 - 266 229 $0.05 / $0.20 128K 1191.244 [1154.6, 1227.9] 349.22 · 不稳 Apache-2.0
6
247.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1175±36.5 240 - 291 238 N/A N/A 1174.785 [1138.3, 1211.3] 346.91 · 不稳 Llama 3.1
7
322.0
olmo-7b-instruct Allen AI · Apache-2.0
1013±23.4 306 - 323 722 $0.20 / $0.20 N/A 1012.712 [989.3, 1036.1] 142.70 · 不稳 Apache-2.0
8
280.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1013±36.1 273 - 319 274 N/A N/A 1012.599 [976.5, 1048.7] 339.97 · 不稳 AI2 ImpACT Low-risk

没有找到相关模型