排名 模型 得分
🥇
168.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1313±11.1 72 - 184 2.9K $0.20 / $0.60 65.5K 1312.761 [1301.7, 1323.9] 32.13 · 不稳 Apache 2.0
🥈
177.0
olmo-3-32b-think Allen AI · Apache 2.0
1293±16.5 118 - 220 1.4K $0.15 / $0.50 65.5K 1292.845 [1276.3, 1309.4] 71.01 · 不稳 Apache 2.0
🥉
206.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1265±13.8 111 - 210 2.0K $0.15 / $0.50 65.5K 1265.206 [1251.4, 1279.0] 49.37 · 不稳 Apache 2.0
4
217.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1224±25.3 172 - 258 463 N/A N/A 1223.952 [1198.7, 1249.2] 166.18 · 不稳 Llama 3.1
5
238.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1194±35.5 214 - 266 261 $0.05 / $0.20 128K 1193.630 [1158.1, 1229.2] 328.59 · 不稳 Apache-2.0
6
247.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1180±26.1 240 - 291 454 N/A N/A 1180.404 [1154.3, 1206.5] 177.24 · 不稳 Llama 3.1
7
280.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1106±34.2 273 - 319 280 N/A N/A 1105.566 [1071.4, 1139.7] 303.73 · 不稳 AI2 ImpACT Low-risk

没有找到相关模型