排名 模型 得分
🥇
177.0
olmo-3-32b-think Allen AI · Apache 2.0
1313±32.4 118 - 220 315 $0.15 / $0.50 65.5K 1312.995 [1280.6, 1345.4] 273.21 · 不稳 Apache 2.0
🥈
168.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1309±22.9 72 - 184 697 $0.20 / $0.60 65.5K 1309.192 [1286.3, 1332.1] 136.98 · 不稳 Apache 2.0
🥉
206.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1296±26.5 111 - 210 474 $0.15 / $0.50 65.5K 1295.591 [1269.1, 1322.1] 183.05 · 不稳 Apache 2.0
4
217.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1242±24.7 172 - 258 397 N/A N/A 1241.625 [1216.9, 1266.3] 158.76 · 不稳 Llama 3.1
5
238.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1207±28.5 214 - 266 375 $0.05 / $0.20 128K 1207.110 [1178.6, 1235.6] 211.73 · 不稳 Apache-2.0
6
247.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1194±25.6 240 - 291 363 N/A N/A 1194.475 [1168.8, 1220.1] 171.15 · 不稳 Llama 3.1
7
280.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1107±19.1 273 - 319 888 N/A N/A 1106.955 [1087.9, 1126.0] 94.78 · 不稳 AI2 ImpACT Low-risk
8
322.0
olmo-7b-instruct Allen AI · Apache-2.0
1017±19.2 306 - 323 848 $0.20 / $0.20 N/A 1017.464 [998.3, 1036.6] 95.64 · 不稳 Apache-2.0

没有找到相关模型